Нейросети

Картинки которые генерирует нейросеть

06.08.2023

Содержание статьи

9 крутых нейросетей, которые создают картинки по тексту

Преимущества нейросетей, генерирующих изображения

Работать с этой нейросетью можно только на английском языке. Так, зайдя на страницу, пользователь сразу увидит строку, в который нужно вводить описание. Также здесь есть несколько инструментов для более точной генерации картинки — для этого нужно, перейдя во вкладку «Select Models», выбрать стиль картинки, ее размер и сделать настройки более тонкими, что улучшит качество изображения.

Еще одна программа, вдохновленная детищем OpenAI — ее создал энтузиаст из Техаса Борис Дайма для участия в конкурсе программистов. Сгенерировать картинку можно на сайте — вы получите сразу девять вариантов запроса не более, чем за две минуты. Правда, изображения в плане детальности уступают топовым проектам — нейронная сеть использует меньший набор параметров и обучена всего на 30 миллионах примеров, хотя создана на той же архитектуре, что и оригинальная DALL·E.

Условия использования: Нужно зарегистрироваться на сайте https://www.midjourney.com/home и добавиться в Дискорд-сервис. Генерировать изображения можно в каналах Newbies по команде /imagine. Далее нужно написать промпт на английском языке и отправить его в чат, и нейросеть начнёт создавать картинку.

Adobe Firefly — это набор инструментов на основе нейросетей, интегрированный в экосистему Adobe Creative Cloud. Функции нейросети для генерации изображений Firefly в настоящее время есть в Photoshop, Illustrator, Adobe Express, Substance 3D, InDesign и Adobe Stock.

Пока автором может считаться только человек, который управляет нейросетью с помощью промптов. Часто авторское право на созданный контент принадлежит компании, которая разработала или использует эту нейросеть. Компании-владельцы разрабатывают свою внутреннюю политику и стандарты, чтобы предотвратить нарушения авторского права.

При этом для того, чтобы создать картинку с помощью нейросети, системе приходится анализировать миллионы изображений, загруженных в ее базу. Как правило, они берутся из интернета и сопровождаются соответствующими подписями. Нейросеть объединяет знания обо всех объектах и в дальнейшем находит нужные фрагменты по ключевым словам в запросе. Например, изучив тысячи фотографий с лемурами, в дальнейшем она сможет создать точное изображение животного, уже зная, в какой позе и где он чаще всего сидит.

В какой-то момент к DALL·E Mini обращались так часто, что компания Hugging Face — владелец серверов, на которых лежал проект — фиксировала по 50 тысяч генераций в сутки (команда не спала ночами, обслуживая нейросеть, пишет Wired). Популярность даже заставила разработчиков сменить название на Craiyon, чтобы алгоритм не ассоциировался с оригинальным проектом OpenAI.

Проект одноименной независимой исследовательской лаборатории под руководством бывшего инженера NASA сейчас тоже на стадии бета-тестирования. Как и остальные, Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.

Обзор нейросетей

Найти чат-бот можно, введя в поисковой строке в Telegram «TurboText. Генератор контента с ИИ». Открыв страницу, необходимо нажать на «start» и выбрать вкладку «создать изображение». Затем система попросит ввести текст для дальнейшей генерации картинки, которую она будет создавать примерно одну минуту, и предоставит готовый вариант.

В этом промпте сразу несколько подводных камней, с которыми может не справиться нейросеть. Флаг Сербии имеет много сложных деталей, у девушки нужно будет прорисовать пальцы, на обложке учебника могут быть надписи, солнце должно бликовать естественно, изображение должно быть реалистичным.

Далее Fusion Brain предложит несколько инструментов для редактирования: различные стили, уменьшение или увеличение картинки, ластик, который позволяет убирать непонравившиеся объекты. Что касается последнего, то после того, как с помощью него будет стерта часть изображения, необходимо вновь ввести текстовый запрос для этой пустой части. В случае, если получившаяся картинка не устраивает, следует еще раз нажать «Создать». Загрузить работу можно с помощью соответствующей кнопки, которая находится в верхней левой части панели.

ЧИТАТЬ ТАКЖЕ: Нейросеть которая делает картинки из слов

Приступим к генерации в демо-версии Exactly. Чтобы обучить нашу модель ИИ, нужно загрузить не менее 5 изображений. Если есть свой фотобанк, это отлично. Допустим, фотобанка нет, поэтому загружаем фото, которые были. Проверяем, чтобы не было повторяющихся картинок и добавляем описания на английском языке.

Exactly.ai — платформа, основанная на искусственном интеллекте, для создания авторских изображений, которые могут быть использованы в бизнес-целях. В целом, это ИИ для создания картинок, художественных картин, авторских цифровых произведений. На платформе можно обучать модель под себя, использовать для генерации новых изображений и полностью контролировать права на свои творения.

Генерация картинок в Dream происходит следующим образом: пользователь, заходя на сайт dream.ai, вводит в специальную строку, внизу которой также есть подсказки описаний, свой запрос и при необходимости выбирает один из художественных стилей, представленных там же. Далее система в течение примерно 5-10 секунд создает картинку, которую пользователь может приблизить, нажав на соответствующий значок на самом изображение, и, если оно ему понравилось, скачать.

Midjourney 6

Сразу обозначим, что нам понадобится конкретная картинка под конкретные задачи, как это обычно и бывает в бизнесе. Нас не интересуют абстрактные цели, как развлечься всем офисом и посмеяться над тем, как зам по финансовой работе мог бы выглядеть, если бы он был котиком.

Firefly создан на основе изображений Adobe Stock, контента с открытой лицензией и разработан таким образом, чтобы его можно было безопасно использовать в коммерческих целях. Авторы Adobe Stock получают вознаграждение за контент, который используется для переобучения моделей Firefly.

Правила использования изображений описаны в пользовательском соглашении. Например, когда компания MidJourney только запустила свой сервис, она сделала генерацию доступной для всех, и картинки принадлежали всем. Любой участник видел творчество других людей и мог публиковать у себя, копировать или использовать как-то ещё. Сейчас права передаются вместе с платной подпиской, но с ограничением, что компания может использовать созданный контент для улучшения работы сервиса.

Для работы с системой необходимо скачать приложение, доступное для iOS и Android. Зайдя в программу, откроется главная страница, в правом верхнем углу которой будет значок «плюс», нажав на который программа предложит создать либо текст, либо изображение. Выбрав второе, откроется поле, в которое нужно ввести текст. Генерация картинки, как правило, занимает около минуты, по истечении которой «Шедеврум» предложит на выбор четыре картинки. Затем одну из них можно будет опубликовать в своем профиле, после чего скачать на устройство.

В целом неплохо. Цвета камешков в короне на флаге не соответствуют действительности, но можно списать на блики солнца, которые исказили их цвет. Есть небольшие погрешности с кистями рук, но все пальцы на месте и их нужное количество. Размер изображения 2048 х 2048 px.

ruDALL-E является первой нейросетью, научившейся генерировать картинки по описанию на русском языке. Эта система была создана командами «Сбера», Sber AI, SberCloud и SberDevices после того, как в январе 2021 года OpenAI представила нейросеть DALL-E. Специалисты воспроизвели ее код и запустили обучение модели на платформе ML Space.

Если добавлять окончание ar 16:9, то нейросеть генерит не квадратные картинки, а прямоугольные. Внизу четырёх вариантов изображений стоят кнопки — выбрать Upscale и скачать в хорошем качестве или доработать вариант. Считаем нумерацию с левой верхней картинки. Выбираем четвёртую и скачиваем.

По словам разработчиков, Imagine работает лучше, чем детище OpenAI. Но верить приходится на слово — проект находится на экспериментальной стадии (и непонятно, когда из нее выйдет). Пока можно ознакомиться с примерами работ, либо попробовать небольшое демо на официальном сайте (нам предлагают составить запрос из нескольких готовых шаблонов).

9 крутых нейросетей, которые создают картинки по тексту

Преимущества нейросетей, генерирующих изображения

Обзор нейросетей

Midjourney 6

ОСТАВЬТЕ ОТВЕТ Отменить ответ

ЭТО ПОПУЛЯРНО

ЭТО ИНТЕРЕСНО

ВЫБОР РЕДАКТОРА