Содержание статьи
Фотореализм в Midjourney: как генерировать в нейросети снимки людей, неотличимые от настоящих
Как генерировать реалистичных людей
Папа Римский в пуховике «Баленсиага», свидание Илона Маска с американским политиком Александрой Окасио-Кортес, никогда не происходившее разрушительное землетрясение в Канаде 2002 года — многие пользователи решили, что это реальность. Midjourney из-за этого уже вводит ограничения и блокирует некоторые запросы. Но фотореализм в нейросетях, видимо, с нами надолго.
Если простым языком: нейронную сеть обучают распознавать нос, глаза, губы брови и генерировать подобные лица. А вообще у генеративно-состязательных нейронных сетей, которые и создают лица, есть 2 составляющих: генератор и дискриминатор. Они взаимообучаются, чтобы научиться создавать лица, похожие на человеческие.
ruDall-E или Kandinsky — ещё один сервис для создания иллюстраций по текстовому описанию. Тут нужно написать задание, выбрать разрешение и стиль: рисунок карандашом, портретное или студийное фото, живопись или классицизм. Дальше ИИ сгенерирует картинку. Вот, что у него получается
Последний фейк даже вызывал реакцию у Midjourney — компания забанила слово «тюрьма» и «арест». Теперь запросы с этими словами нейросеть больше не генерирует. Обойти ограничение несложно: для этого нужно переформулировать промпт и написать «Дональд Трамп в наручниках в окружении полиции».
Раньше после регистрации пользователю давали 25 бесплатных генераций. Сейчас работать можно только на платном тарифе, поэтому своего персонажа я рисовала с помощью других сервисов. Но покажу, что умеет Midjourney на примере персонажей, которых создают другие пользователи.
Искусственный интеллект умеет многое, в том числе создавать людей. Нейросети генерируют лица, придумывают характер и даже анимируют человека. Я протестирую нейросеть для создания людей по описанию. Посмотрю, как ИИ сгенерирует человека, а ещё персонажа для книги.
Изображение людей
Для этого добавьте в запрос ссылку на картинку, скопируйте запрос, по которому она сгенерировалась, и поменяйте какую-нибудь деталь. Например, я сгенерировала девушку в зимней одежде, а затем изменила время года на лето: одежду я отдельно не прописывала, но нейросеть автоматически поменяла шапку на летнюю шляпку.
Почти невозможно распознать изображение фальшивого человека. ИИ настолько развит, что 90 % подделок не распознаются обычным человеком, а 50 % не распознаются опытным фотографом. Услуг по распознаванию не существует. Иногда нейронная сеть допускает ошибки, из-за чего появляются артефакты: неправильно изогнутый узор, странный цвет волос и так далее.
2022 год стал годом нейросетей, рисовавших арты не хуже человека. В 2023 году пришло время фотографий: фотореализм в Midjourney v5 вышел на абсолютно новый уровень. Если раньше нейросетевые фото можно было отличить по косым глазам или восьми пальцам на руке, то теперь ситуация иная.
Жаль только, что ИИ не нарисовал девушку в полный рост. Не получилось даже когда я добавила это в запрос, чтобы нейросеть поняла, чего я хочу. С ростом тут есть проблемы. Если писать задание одной фразой — «брюнетка в полный рост», ИИ справляется. Но тогда нет нужной одежды и лицо не совсем такое, как надо. Если добавить каплю подробностей — про голубые глаза и синий костюм, ИИ рисует портрет.
Чтобы понять, как пользоваться Midjourney и как составлять простые запросы, читайте наш гайд. В этом тексте я разберу частный случай: как писать промпты для генерации реалистичных картинок в пятой версии нейросети. Чтобы достичь таких же результатов, обязательно включите v5 — через команду —v5 к промпту или в настройках.
Такие же неровные проблемы с зубами тоже довольно распространены. Ищите странные характеристики, такие как пиксели и повторяющиеся резцы. Накладные волосы, в общем, могут казаться с некоторым свечением вокруг них или выглядеть слишком прямыми и с прожилками, опять же, с видимой асимметрией.
Artflow
Генератор лиц ИИ работает на базе StyleGAN, нейронной сети от Nvidia, разработанной в 2018 году. GAN состоит из 2 конкурирующих нейронных сетей, одна из которых что-то генерирует, а вторая пытается определить, являются ли результаты реальными или генерируются первой. Обучение заканчивается, когда первая нейронная сеть начинает постоянно обманывать вторую.
Здесь можно создать готового персонажа: его характер, повадки, цели и даже пообщаться с ним. Inworld AI — это также нейросеть для создания голоса человека: пишем любой вопрос и сервис будет озвучивать ответы. Я указала только имя героя и род занятий — путешествия во времени, черты характера ИИ прописал сам.
Для пользователя все работает очень просто. Как только вы попадаете на сайт, генерируется случайное лицо. Вы можете скачать картинку, если хотите. Обновите страницу, если вам не нравится человек, с которым вы встречаетесь. Если вы видите то же самое лицо, просто подождите пару секунд и снова обновите страницу. На веб-сайте показаны результаты работы генератора (которые обновляются каждые 2-3 секунды), а не сам генератор.
Укажите имена знаменитостей. Вместо объекта пропишите в запросе имя и фамилию человека: нейросеть знает, как выглядит Илон Маск, Леонардо ДиКаприо, Пэрис Хилтон, Билл Клинтон и другие известные личности. Российские знаменитости вряд ли получаются — только если их фото широко представлены в англоязычном пространстве рунета.
Фотореализм по умолчанию. Раньше сгенерировать фотографию в Midjourney было непросто. По запросу вроде «Девушка на улице» нейросеть рисовала арт, а для превращения в снимок приходилось задавать множество дополнительных параметров: тип камеры, жанр съемки, имя знаменитого фотографа.
Но есть и другой вариант. На сайте fusionbrain.ai есть редактор, в котором можно сгенерировать картинку по текстовому описанию и отредактировать её. Картинки получаются намного интереснее, хотя этот тот же Kandinsky. А ещё здесь можно попросить ИИ перерисовать отдельные элементы.
Превентивно Midjourney забанила генерацию изображений китайского президента Си Цзиньпина. CEO компании прокомментировал это решение так: «Политическая сатира в Китае неприемлема. Возможность людей в Китае использовать эту технологию важнее, чем ваша возможность генерировать сатиру». Таким образом в компании намекнули на то, что Midjourney могли бы заблокировать в стране, если бы такие картинки завирусились.
Детальное описание одежды выглядит так: woman wearing a stunning white lace Gucci gown with a full tulle skirt, intricate lace detailing, long lace sleeves, a high collar, and a fitted bodice adorned with delicate floral appliques. Буквально: «женщина в потрясающем белом кружевном платье „Гуччи“ с юбкой из тюля, сложным кружевом, длинными кружевными рукавами, высоким воротником и приталенным лифом, украшенным нежными цветочными аппликациями».