Содержание статьи
Нейросеть, которая рисует по словам на русском
Шаг 1. Откройте «Генератор изображений»
Основная функциональность реализована на платформе Fusion Brain, для начала работы с которой достаточно ввести email и подтвердить регистрацию. После этого вы попадёте в раздел «Картинки» и сможете описать изображение. Также на сайте есть раздел «Видео», где можно сгенерировать короткий ролик или анимацию с помощью нейросети Kandinsky Video 1.1.
Однако на одной Midjourney свет клином не сошёлся. Команда ProductStar вместе с Павлом Исаенко, дизайн-директором в «Яндексе», составила подборку нейросетей, которые умеют создавать картинки по текстовым запросам и фото не хуже, а может, даже и лучше. Чтобы конкурс был честным, всем участникам предложили одно и то же задание — сгенерировать симпатичного слона в городе.
Для многих основной барьер при работе с нейросетями — знание английского языка для текстовых описаний. Нейросеть от Сбера решает эти проблемы: она хорошо понимает русскоязычные команды. Если предыдущие версии Kandinsky уже сильно устарели, то новая приближается по уровню генерации и стилистике к Midjourney v5 — это отличный уровень.
Stable Diffusion — это нейронная сеть с открытым исходным кодом. Если её обучить, вы получите больше ИИ-инструментов для самовыражения. Чтобы использовать все возможности генерации изображений, Stable Diffusion нужно установить на компьютер. Вот минимальные требования:
Помимо онлайн-версии, вы можете скачать мобильное приложение для iOS и Android. Однако на момент обзора в нём не получится бесплатно сгенерировать картинки — требуется подписка. В приложении можно редактировать фотографии и загружать собственные изображения для добавления различных эффектов с помощью нейросети. Например, можно вставить фото известной личности рядом с вашим фотопортретом.
Текстовый запрос можно дополнить референсным изображением или поделиться с нейросетью снимком экрана — тоже прямо в процессе формулирования запроса и без сторонних приложений. А можно дать доступ к камере вашего устройства и использовать для генерации снимок с нее.
Шаг 3. Введите описание к картинке и оцените полученный результат
Нейросеть позволяет создавать картинки по фото или по текстовому запросу на английском языке. Stable Diffusion также понимает русский язык, но результат генерации может быть менее точным. Вы можете выбрать стиль изображения — например, создать собственный портрет в стиле аниме или сгенерировать 3D-модель домашнего животного. Кроме того, можно задать разные соотношения сторон и установить нужное количество вариантов, которые будут генерироваться по одному промпту.
Чтобы создавать картинки, присоединитесь к серверу Midjourney в Discord, ознакомьтесь с правилами сообщества и оплатите подписку. Дальше нужно либо добавить бота Midjourney на свой сервер, либо генерировать в одном из общих чатов. Для этого достаточно ввести команду /imagine и сформулировать запрос на английском языке. Сервис создаст четыре варианта, у каждого можно увеличить разрешение или попросить нейросеть переделать в том же духе. Возможность генерировать картинки прямо на сайте Midjourney вводят постепенно.
Чтобы сразу вам показать, насколько красочные и красивые изображения рисует наша нейронная сеть, давайте взглянем на пример. Мы попросили нейросеть нарисовать космос (с некоторыми пояснениями). Указали, что хотим получить 4 картинки в разрешении 768 на 768 пикселей. Количество шагов генерации указали равным 50.
Одной из главных особенности нашей нейронной сети является поддержка русского языка. В отличие от других аналогов, вы сможете писать описание к картинке прямо на родном языке и получать рисунки максимально соответсвующие вашей задумке. Наш ИИ специально обучен для того, чтобы рисовать по русским словам.
В современном мире очень важную роль играет искусственный интеллект, поэтому нейросети выходят на первый план при выполнении многих задач, которые требуют ручной работы. И создание качественных изображений — одна из них. И это всё ещё творческая задача, только теперь творчеческой составляющей является не сам процесс рисования пикселей, а задумка и правильное формулирование задачи для нейронной сети. Поэтому целесообразно рассмотреть плюсы и минусы использования ИИ для создания изображений.
Текст промпта можно написать на русском или английском языке — достаточно в произвольной форме описать то, что вы хотите получить. Для описания можно использовать ИИ-ассистента ArtGPT, который поможет уточнить контекст и создать более детализированное изображение. Ещё есть вкладка «Негативный промпт», в которой можно записать всё, что искусственный интеллект изображать не должен.
Плюсы использования нейросетей для генерации изображений
Нейросеть понимает запросы на русском языке, хотя с английским результат может быть лучше. Фотореализм — не самая сильная сторона Dall-E , здесь сервис уступает Midjourney. Зато можно добиться более точного соответствия промпту при нестандартных запросах, когда хочется изобразить что-то , чего в реальности нет. Для тех, кто не определился, что хочется увидеть, есть кнопка «Удивите меня» — ИИ предложит свои варианты.
Lexica — это платный онлайн-сервис, доступный только авторизованным пользователям. Минимальный тариф стоит 8 долларов в месяц при плате за год и включает 1000 быстрых генераций, при которых используются самые мощные серверы компании. Если вы исчерпаете лимит генераций на стартовом тарифном плане, то до начала следующего месяца создавать новые изображения будет невозможно.
По каждому запросу получается четыре варианта картинки. Стиль, качество, степень детализации и фотореалистичность зависят от запроса. Модель Lexica Aperture позволяет получать очень качественные арты, но надо потренироваться писать для нее промпты — как и для Stable Diffusion, на которой она основана.
Нейросеть порой может ошибаться или не всегда получается то, что вам нужно. Поэтому, чтобы не тратить лишнее время на повторные генерации, вы можете прямо на странице генерации задавать количество изображений, которые искусственный интеллект будет создавать одновременно. То есть по одному описанию вы можете получить до 9 изображений. Всё зависит от того, сколько вы сами укажите.
В день вы можете использовать 25 улучшений, позволяющих создавать картинки без очереди. Как только улучшения закончатся, время ожидания рисунка увеличится. Нейросеть создаёт сразу четыре иллюстрации за один запрос и сохраняет их историю. Таким образом, вы можете сгенерировать несколько вариантов и выбрать из них лучший.
На главном экране будет указано время ожидания, и до наступления часа икс вы можете закрыть приложение, не переживая, что позиция в очереди изменится. Не нужно будет доказывать кому-то: «Вы здесь не стояли, а я здесь стоял». Когда картинка будет готова, вы получите пуш-уведомление.
Также прямо в интерфейсе есть функции по скачиванию понравившихся изображений и их предпросмотру. На случай если вам надо их покрутить или увеличить вы можете это делать прямо в нашем редакторе. Также мы адаптировали интерфейс для мобильных устройств, поэтому вы можете генерировать картинки прямо с телефона!
Очень часто, когда вы пишете текст, вам необходимо также найти или приложить какие-то иллюстрации. Заказчики бывают лояльными и допускают использование неуникальных изображений. Но гораздо лучше, если вы сможете вместе с текстом предоставлять качественные и уникальные картинки, которые можно сгенерировать с помощью нашей нейросети. Это будет большим плюсом как для вас (выделит на фоне конкурентов), так и для заказчиков (уникальные картинки лучше воспринимаются поисковиками).