Содержание статьи
Midjourney: погружение в воображаемые миры
Что такое Midjourney
Midjourney может создавать картины, делать стилизации в духе популярных фильмов, а также выдумывать облики сказочных существ. Если раньше для того, чтобы заниматься графикой, требовался талант или специальное образование, то благодаря Midjourney воплощать свои графические идеи смогли даже те, кто вообще не умеет рисовать.
Нажмите на белую иконку с корабликом в левом меню, чтобы перейти в чат Midjourney. В нём вы увидите сообщения разработчиков об обновлениях. Вам же нужно перейти в блок Newcomer Room ― раздел для новых пользователей ― и выбрать в нём чат, название которого начинается с newbies.
Из предыдущего абзаца вы уже знаете, что сайт DreamStudio основан на модели искусственного интеллекта от Stable Diffusion и тоже предлагает пользователю набор функций для генерации изображений. В этом случае вам уже понадобится создать аккаунт, поскольку на него будет бесплатно начислено определенное количество кредитов, которых вполне достаточно для первого времени работы с нейросетью.
Несмотря на то что громко заговорили о нейросетях лишь недавно, такие корпорации, как Google, Apple, «Яндекс» начали использовать возможности ИИ более десяти лет назад. Так, ещё в 2009 году «Яндекс» интегрировал в свою поисковую систему метод «Матрикснет», который строит ранжирование ссылок на основе обучения. А в 2010 году Apple приобрели Siri ― она распознаёт речь с помощью искусственного интеллекта.
Первая бета-версия Midjourney появилась в 2022 году. Изначально программа давала 25 бесплатных попыток, которых хватало максимум на 12 изображений. Но недавно Midjourney ввела ограничения для новых пользователей, сократив время для бесплатной генерации изображений до 15 минут, причём даже эта возможность доступна не всегда.
Режимы Style от low до high задают, насколько творчески сеть должна подходить к технике рисунка. Чем более высокий уровень выставлен в настройках, тем свободнее будет стилизация изображения. Эффект может быть интересным, но управлять фантазией нейросети сложно.
Шаг 7: настройки нейросети
Пока что нейросети не до конца научились делать симметричные объекты, поскольку не совсем понимают, что же они рисуют. За время обучения алгоритмы хорошо усваивают, как устроены лица и морды животных, симметрия тела и насекомых. При этом им пока что не под силу опознать устройство, например, человеческой одежды. Нередко пиджаки имеют полы разной длины, левая часть предмета не соответствует правой. Симметричные узоры также выглядят идеальными лишь на первый взгляд ― творчество нейросети в них выдаёт несовпадение в мелочах, если приглядеться.
Впрочем, если вы заинтересованы в создании профессиональных сгенерированных изображений и собираетесь их использовать в своих целях, в том числе и коммерческих, точно стоит подождать выдачи доступа, чтобы сполна оценить все функциональные возможности Leonardo AI.
На основном принципе работы я останавливаться не буду, поскольку он предельно понятен и не отличается от других нейросетей. Вместо этого я уделю больше внимания особенностям Leonardo AI, которые точно заставят вас обратить внимание на данную нейронку. Прежде всего, она может дорисовывать изображение практически до бесконечности. Вы просто выделяете область и задаете подсказки, чем она должна заполниться. Далее в уже готовом рисунке тоже можно выделить одну из областей, заменить ее, дорисовать что-то или просто немного поменять элемент, если он выглядит некачественно. Это позволит сделать Leonardo AI полноценным инструментом для рисования, доводя изображения до такого состояния, как нужно именно AI-художнику.
Добавление двойного двоеточия :: к подсказке указывает роботу Midjourney, что он должен рассматривать каждую часть подсказки отдельно. В приведенном ниже примере для подсказки hot dog все слова считаются вместе, а Midjourney Bot создает изображения вкусных хот-догов. Если подсказка разделена на две части, hot:: dog оба понятия рассматриваются отдельно, создавая картину «горящей» собаки. Между двойными двоеточиями нет пробела!
Нейросети хорошо справляются с крупными планами, поскольку они содержат меньше деталей. Ведь чем больше разнородных элементов на картинке, тем сложнее не ошибиться в их воспроизведении. По этой же причине нейросети почти всегда размывают фон за главным героем.
Попытки создать подобную программу были и раньше. Например, приложение Prisma превращало фотографии в «картины», используя стили знаменитых художников. Несмотря на успех Prisma, Midjourney выигрывает как в популярности, так и в функциональности. Эта нейросеть может не только копировать и применять стили, но также создавать собственные изображения с нуля и даже имитировать фото.
Шаг 2: создание сервера
Многие думают, что если изображение создала нейросеть, то права на него автоматически принадлежат пользователю-автору, ведь нейросеть ― это технология и обладать авторскими правами она не может. Но всё не так просто. Разработчики вложили в создание сети немало ресурсов, а сама Midjourney принадлежит компании Midjourney Inc.
Очень часто нейросети изображают руки с большим количеством пальцев, положение которых далеко от физиологичного. Проблема частично устранена только в последней версии Midjourney, при более ранних версиях приходилось использовать сторонний плагин, исправляющий эту ошибку.
После регистрации в Discord, у Вас могут попросить ввести мобильный номер телефона. Если Ваш номер уже используется в Discord и вам нужно зарегистрировать другой аккаунт, воспользуйтесь сервисом приёма виртуальных смс. Как им воспользоваться, в Главе №4, ниже на странице.
Сам интерфейс сайта значительно удобнее, чем оригинальная демоверсия, поскольку здесь имеется встроенный навигатор по промтам, поддерживается загрузка исходного изображения, которое ИИ будет брать в качестве примера для будущих генераций, есть ряд дополнительных настроек и даже встроенный редактор. Все это делает DreamStudio хорошим вариантом для тех, кто собирается много экспериментировать с созданием картинок на самые разные темы.
Нейросеть Midjourney работает на основе двух научных достижений в области работы над ИИ ― возможности распознавать человеческую речь и умении создавать картинки и образы. Программа использует глубокое обучение и выстраивает взаимосвязи между введённым запросом от человека и данными из огромной загруженной в неё библиотеки.
В 2022 году Хани Фарид, профессор из Калифорнийского университета в Беркли, и Софи Найтингейл из Ланкастерского университета в Англии провели исследование. В его ходе они предлагали испытуемым определить, какой портрет сделан при помощи фотографии, а какой ― нейросетью. По итогам выяснилось, что участники смогли определить настоящие лица лишь с точностью в 48,2%.