Как написать нейросеть которая генерирует изображения

0
14

Как пользоваться Midjourney для гене­рации картинок и правильно состав­лять запросы

Starryai — рисует картинки по референсам

Для начала работы перейдите во вкладку Generate, введите текстовый запрос и при необходимости добавьте негативный промпт — элементы, которые вы не хотите видеть на фото. Также можно изменить разрешение и ориентацию изображения, а после генерации отредактировать его.

Как сгенерировать свое первое изображение. Зайдите в один из чатов Newbies и введите в поле для отправки сообщения команду /imagine. Появится плашка Prompt: все, что вы напишете после нее, станет частью запроса. Описание картинки для нейросети лучше формулировать на английском языке. Другие языки Midjourney понимает гораздо хуже. Если не знаете английский, пользуйтесь нейросетевым переводчиком DeepL.

Используйте изображения как референс. В запрос можно добавить прямую ссылку на картинку, которая вам нравится, или даже несколько. При генерации нейросеть учтет не только слова в запросе, но и эти изображения. Можно указать, насколько весомым должен быть вклад референса, с помощью параметра —iw. Подробнее — в разделе с полезными короткими командами.

Scribble Diffusion — это нейросеть, которая генерирует картинки на основе ваших рисунков. Для начала работы вам нужен персональный токен, который новые пользователи получают после авторизации через GitHub-аккаунт. Зарегистрируйтесь, введите токен и можете начинать.

После регистрации вы попадёте на главную страницу, где сможете создать скетч и детализировать его с помощью описания. Укажите в запросе стиль картинки, элементы на переднем плане и на фоне, действия объекта и любые другие детали, которые помогут дополнить набросок.

Чтобы сделать в Midjourney просто красивую картинку, можно написать в запросе практически что угодно: модель настроена так, что результат будет приятен глазу. Но если вы хотите получить конкретный результат, стоит научиться писать запросы. Часть этих принципов сформулировали разработчики в своих официальных анонсах, до других лайфхаков пользователи дошли опытным путем. Вот некоторые из них.

Но к таким ботам нужно относиться осторожно: за названием Midjourney в «Телеграме» может скрываться любая нейросеть или вообще уже готовая база сгенерированных картинок. Тем более что боты преимущественно платные — после пары тестовых попыток появляются предложения купить премиум.

Если пяти бесплатных генераций вам оказалось недостаточно, Lumen можно купить отдельно — от 40 до 1000 штук. За 40 штук нужно заплатить 15,99 доллара. Также Lumen можно зарабатывать, рассказывая о сервисе в различных соцсетях и на других платформах. Например, вы можете заработать 3 Lumen, опубликовав своё творение и упомянув «starryai» на любом сабреддите.

Dream by Wombo — бесплатно создаёт эстетичные иллюстрации

После выбора стиля сгенерируйте текстовый запрос. Если у вас есть фотореференс, нажмите на кнопку «Загрузить изображение», и нейросеть возьмёт её за основу. Кнопка Prompt builder предлагает выбрать стилистику: текстуры, направления в живописи, а также имена известных художников. Кнопка Inspire me генерирует с помощью искусственного интеллекта случайный запрос, который вы можете взять для вдохновения.

ЧИТАТЬ ТАКЖЕ:  Искусственный интеллект который пишет сочинение

Получать картинки можно с компьютера и из приложения на смартфоне. За одну генерацию сервис создаёт девять вариантов в разрешении 256×256 пикселей. Вы можете выбрать понравившееся изображение и улучшить его с помощью ИИ-функции Upscale до разрешения 1024×1024 пикселя.

—iw. В Midjourney можно загружать картинки в качестве референса — одну или несколько для каждого запроса. И можно указать «вес» — чем больше, тем сильнее картинки будут влиять на результат. Значение по умолчанию — 1 , допустимый диапазон в Midjourney v6 — от 0 до 3, число не обязательно должно быть целым — 0.5 тоже годится.

По умолчанию сервис рекомендует использовать модель DALL-E 3. Одна стандартная картинка в разрешении 1024×1024 пикселя стоит 2 кредита. Пример такого рисунка вы можете увидеть выше. За дополнительные кредиты можно изменить разрешение и повысить качество изображения.

Easy-Peasy.AI — это онлайн-сервис, который позволяет создавать изображения с помощью одной из четырёх нейросетей: DALL-E 3, Midjourney v6, Stable Diffusion 3.0 и Stable Diffusion XL. Помимо выбора нейросети, вы можете задать стиль изображения или указать имя художника, чей стиль искусственный интеллект должен будет воспроизвести. Однако есть ограничение: стили современных художников нельзя скопировать из-за авторских прав.

Стало: a confident corgi biker, dressed in a miniature leather jacket, custom-fit helmet with goggles, and a whimsical bandana, striking a pose on a classic Harley-Davidson motorcycle. The scene is set on an open road, cutting through a breathtaking landscape at sunset , with the warm glow of the setting sun illuminating the scene, creating long shadows and a sense of boundless freedom. The composition focuses on the corgi’s adventurous spirit, with a blurred background to emphasize the main subject.

—no. Параметр, в котором можно прописать, чего на картинке быть не должно. Например, —no plants — рисовать сюжет без растений. Но важно учесть, что нежелательные предметы надо еще правильно назвать: хеллоуинская ведьма с параметром —no hat все еще будет в остроконечном колпаке. Потому что колпак называется witch’s hat — вот его-то и надо исключать.

Однако на одной Midjourney свет клином не сошёлся. Команда ProductStar вместе с Павлом Исаенко, дизайн-директором в «Яндексе», составила подборку нейросетей, которые умеют создавать картинки по текстовым запросам и фото не хуже, а может, даже и лучше. Чтобы конкурс был честным, всем участникам предложили одно и то же задание — сгенерировать симпатичного слона в городе.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь