Содержание статьи
9 крутых нейросетей, которые создают картинки по тексту
Преимущества нейросетей, генерирующих изображения
Работать с этой нейросетью можно только на английском языке. Так, зайдя на страницу, пользователь сразу увидит строку, в который нужно вводить описание. Также здесь есть несколько инструментов для более точной генерации картинки — для этого нужно, перейдя во вкладку «Select Models», выбрать стиль картинки, ее размер и сделать настройки более тонкими, что улучшит качество изображения.
Еще одна программа, вдохновленная детищем OpenAI — ее создал энтузиаст из Техаса Борис Дайма для участия в конкурсе программистов. Сгенерировать картинку можно на сайте — вы получите сразу девять вариантов запроса не более, чем за две минуты. Правда, изображения в плане детальности уступают топовым проектам — нейронная сеть использует меньший набор параметров и обучена всего на 30 миллионах примеров, хотя создана на той же архитектуре, что и оригинальная DALL·E.
Условия использования: Нужно зарегистрироваться на сайте https://www.midjourney.com/home и добавиться в Дискорд-сервис. Генерировать изображения можно в каналах Newbies по команде /imagine. Далее нужно написать промпт на английском языке и отправить его в чат, и нейросеть начнёт создавать картинку.
Adobe Firefly — это набор инструментов на основе нейросетей, интегрированный в экосистему Adobe Creative Cloud. Функции нейросети для генерации изображений Firefly в настоящее время есть в Photoshop, Illustrator, Adobe Express, Substance 3D, InDesign и Adobe Stock.
Пока автором может считаться только человек, который управляет нейросетью с помощью промптов. Часто авторское право на созданный контент принадлежит компании, которая разработала или использует эту нейросеть. Компании-владельцы разрабатывают свою внутреннюю политику и стандарты, чтобы предотвратить нарушения авторского права.
При этом для того, чтобы создать картинку с помощью нейросети, системе приходится анализировать миллионы изображений, загруженных в ее базу. Как правило, они берутся из интернета и сопровождаются соответствующими подписями. Нейросеть объединяет знания обо всех объектах и в дальнейшем находит нужные фрагменты по ключевым словам в запросе. Например, изучив тысячи фотографий с лемурами, в дальнейшем она сможет создать точное изображение животного, уже зная, в какой позе и где он чаще всего сидит.
В какой-то момент к DALL·E Mini обращались так часто, что компания Hugging Face — владелец серверов, на которых лежал проект — фиксировала по 50 тысяч генераций в сутки (команда не спала ночами, обслуживая нейросеть, пишет Wired). Популярность даже заставила разработчиков сменить название на Craiyon, чтобы алгоритм не ассоциировался с оригинальным проектом OpenAI.
Проект одноименной независимой исследовательской лаборатории под руководством бывшего инженера NASA сейчас тоже на стадии бета-тестирования. Как и остальные, Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.
Обзор нейросетей
Найти чат-бот можно, введя в поисковой строке в Telegram «TurboText. Генератор контента с ИИ». Открыв страницу, необходимо нажать на «start» и выбрать вкладку «создать изображение». Затем система попросит ввести текст для дальнейшей генерации картинки, которую она будет создавать примерно одну минуту, и предоставит готовый вариант.
В этом промпте сразу несколько подводных камней, с которыми может не справиться нейросеть. Флаг Сербии имеет много сложных деталей, у девушки нужно будет прорисовать пальцы, на обложке учебника могут быть надписи, солнце должно бликовать естественно, изображение должно быть реалистичным.
Далее Fusion Brain предложит несколько инструментов для редактирования: различные стили, уменьшение или увеличение картинки, ластик, который позволяет убирать непонравившиеся объекты. Что касается последнего, то после того, как с помощью него будет стерта часть изображения, необходимо вновь ввести текстовый запрос для этой пустой части. В случае, если получившаяся картинка не устраивает, следует еще раз нажать «Создать». Загрузить работу можно с помощью соответствующей кнопки, которая находится в верхней левой части панели.
Приступим к генерации в демо-версии Exactly. Чтобы обучить нашу модель ИИ, нужно загрузить не менее 5 изображений. Если есть свой фотобанк, это отлично. Допустим, фотобанка нет, поэтому загружаем фото, которые были. Проверяем, чтобы не было повторяющихся картинок и добавляем описания на английском языке.
Exactly.ai — платформа, основанная на искусственном интеллекте, для создания авторских изображений, которые могут быть использованы в бизнес-целях. В целом, это ИИ для создания картинок, художественных картин, авторских цифровых произведений. На платформе можно обучать модель под себя, использовать для генерации новых изображений и полностью контролировать права на свои творения.
Генерация картинок в Dream происходит следующим образом: пользователь, заходя на сайт dream.ai, вводит в специальную строку, внизу которой также есть подсказки описаний, свой запрос и при необходимости выбирает один из художественных стилей, представленных там же. Далее система в течение примерно 5-10 секунд создает картинку, которую пользователь может приблизить, нажав на соответствующий значок на самом изображение, и, если оно ему понравилось, скачать.
Midjourney 6
Сразу обозначим, что нам понадобится конкретная картинка под конкретные задачи, как это обычно и бывает в бизнесе. Нас не интересуют абстрактные цели, как развлечься всем офисом и посмеяться над тем, как зам по финансовой работе мог бы выглядеть, если бы он был котиком.
Firefly создан на основе изображений Adobe Stock, контента с открытой лицензией и разработан таким образом, чтобы его можно было безопасно использовать в коммерческих целях. Авторы Adobe Stock получают вознаграждение за контент, который используется для переобучения моделей Firefly.
Правила использования изображений описаны в пользовательском соглашении. Например, когда компания MidJourney только запустила свой сервис, она сделала генерацию доступной для всех, и картинки принадлежали всем. Любой участник видел творчество других людей и мог публиковать у себя, копировать или использовать как-то ещё. Сейчас права передаются вместе с платной подпиской, но с ограничением, что компания может использовать созданный контент для улучшения работы сервиса.
Для работы с системой необходимо скачать приложение, доступное для iOS и Android. Зайдя в программу, откроется главная страница, в правом верхнем углу которой будет значок «плюс», нажав на который программа предложит создать либо текст, либо изображение. Выбрав второе, откроется поле, в которое нужно ввести текст. Генерация картинки, как правило, занимает около минуты, по истечении которой «Шедеврум» предложит на выбор четыре картинки. Затем одну из них можно будет опубликовать в своем профиле, после чего скачать на устройство.
В целом неплохо. Цвета камешков в короне на флаге не соответствуют действительности, но можно списать на блики солнца, которые исказили их цвет. Есть небольшие погрешности с кистями рук, но все пальцы на месте и их нужное количество. Размер изображения 2048 х 2048 px.
ruDALL-E является первой нейросетью, научившейся генерировать картинки по описанию на русском языке. Эта система была создана командами «Сбера», Sber AI, SberCloud и SberDevices после того, как в январе 2021 года OpenAI представила нейросеть DALL-E. Специалисты воспроизвели ее код и запустили обучение модели на платформе ML Space.
Если добавлять окончание ar 16:9, то нейросеть генерит не квадратные картинки, а прямоугольные. Внизу четырёх вариантов изображений стоят кнопки — выбрать Upscale и скачать в хорошем качестве или доработать вариант. Считаем нумерацию с левой верхней картинки. Выбираем четвёртую и скачиваем.
По словам разработчиков, Imagine работает лучше, чем детище OpenAI. Но верить приходится на слово — проект находится на экспериментальной стадии (и непонятно, когда из нее выйдет). Пока можно ознакомиться с примерами работ, либо попробовать небольшое демо на официальном сайте (нам предлагают составить запрос из нескольких готовых шаблонов).