Содержание статьи
16 лучших нейросетей для создания картинок: бесплатные и платные
Adobe Photoshop
Midjourney — одна из самых популярных нейросетей, с которыми можно работать онлайн. Вот в этом тексте мы писали о том, как генерировать в ней картинки по текстовому запросу. С изображениями она тоже умеет работать — для этого понадобится загрузить картинку на какой-нибудь хостинг, и вставить ссылку в запрос сразу после команды /imagine. Ну а после этого уже написать, что с ней сделать. Например, можно попробовать сделать портрет мужа из пиццы:
Не очень высокое качество отрисовки, тем не менее, не помешало проекту взорвать интернет. Довольно быстро появился форум на Reddit (сейчас там больше 100 тысяч подписчиков) и Twitter-сообщество (миллионник), где пользователи делятся самыми безумными вариантами генерации — нередко из них рождаются новые мемы (вот, например, Танос, который ищет свою маму в супермаркете Walmart, а вот Дарт Вейдер, попавший на камеру видеонаблюдения во время брейкданса).
Работает алгоритм не идеально — он ближе к уже устаревшей первой версии американской DALL·E. Однако это все еще самая сложная нейросеть в РФ. На ее тренировку ушло 24 тысяч GPU-дней — так называют произведение задействованных GPU (графических процессоров) и дней, которые ушли на обучение алгоритма (так, если вы используете 5 GPU и тренируете сеть 5 дней, потратите 25 GPU-дней).
А если закрасить только часть — например, сделать маску на месте головы, нейросеть нарисует новую в нужном стиле, и даже более-менее прилично присоединит её к туловищу (примерно на уровне человека, второй раз в жизни открывшего фотошоп). К сожалению, на человека с фотографии сгенерированные головы не похожи совершенно.
Среди них есть такие, как Skin Smoothing (Выравнивание цвета кожи) для быстрой ретуши кожи, Colorize (Тонирование) для раскрашивания чёрно-белых фотографий, Makeup Transfer (Перенос макияжа) и Smart Portrait (Умный портрет), способный поменять грустное выражение лица на улыбку и наоборот.
YandexART – это картиночная нейросеть от Яндекса; генеративная модель, которая поможет воплотить ваши идеи в жизнь. С помощью ИИ вы можете создать детальные и реалистичные изображения, а также анимацию – для этого просто введите свой текстовый запрос.
В какой-то момент к DALL·E Mini обращались так часто, что компания Hugging Face — владелец серверов, на которых лежал проект — фиксировала по 50 тысяч генераций в сутки (команда не спала ночами, обслуживая нейросеть, пишет Wired). Популярность даже заставила разработчиков сменить название на Craiyon, чтобы алгоритм не ассоциировался с оригинальным проектом OpenAI.
А в свежей бета-версии фотошопа появился новый нейросетевой инструмент Generative Fill. С его помощью можно убрать лишние элементы с фотографии, можно расширить изображение, заполнив с помощью нейросети пустые области, поменять причёску модели или нарисовать замок в пейзаже и облака над ним.
RuDALL-E — российский ответ Илону Маску
Работает Generative Fill на облачных серверах Adobe. Плюсы такого решения в том, что для работы нейросети не нужен сверхмощный компьютер с новейшей видеокартой — достаточно такого, на котором запустится Photoshop (на сегодняшний день для этого он хочет 64-битный процессор с частотой от 2 ГГц, 8 Гб оперативки и видеокарту с 1,5 Гб видеопамяти). Минус в том, что для работы потребуется лицензионный фотошоп с оплаченной подпиской Creative Cloud — такой в России нынче сложно получить.
В теории это всё звучит хорошо. Но на практике всё не так просто. Во-первых, для нормальной работы нейросети требуется современный компьютер с хорошей видеокартой и объёмом видеопамяти не менее 6-8 Гб. Для запуска хватит и GTX 1660 Super, а вот если хочется работать быстро и не тратить по несколько минут на генерацию, стоит брать карту не хуже, чем GeForce RTX 4070Ti на 12GB.
Во-вторых, чтобы добиться нужного результата от Stable Diffusion, придётся потратить время и разобраться в тонкостях её работы. У этой нейросети, как и у любой уважающей себя программы с открытым исходным кодом, существуют разные сборки и множество моделей генерации. Плюс различные расширения, которые должны помочь в работе — их нужно устанавливать отдельно и разбираться ещё и с их настройками.
Недавно бета-версия DALL·E 2 стала доступна онлайн — чтобы протестировать ее, нужно встать в лист ожидания и дождаться очереди. Если же хочется понять прямо сейчас, на что способны современные нейросети, составили подборку программ на базе ИИ, которые создают картинки по текстовому описанию. Одни из них идеально подходят для портретов, другие — для сюрреалистичного искусства и иллюстраций. Можете испытать их сами или посмотреть на картинки, которые сгенерировали мы.
Еще одна программа, вдохновленная детищем OpenAI — ее создал энтузиаст из Техаса Борис Дайма для участия в конкурсе программистов. Сгенерировать картинку можно на сайте — вы получите сразу девять вариантов запроса не более, чем за две минуты. Правда, изображения в плане детальности уступают топовым проектам — нейронная сеть использует меньший набор параметров и обучена всего на 30 миллионах примеров, хотя создана на той же архитектуре, что и оригинальная DALL·E.
Брейкданс Дарта Вейдера, падение астероида на Землю и животные в исторических костюмах — для искусственного интеллекта нет невозможного. Выбрали интересные проекты от Google, Сбера, NVIDIA и даже от бывшего инженера NASA, которые позволяют генерировать изображения по самым безумным описаниям — многие из них можно попробовать бесплатно.
Далее нужно пополнить баланс в системе – для этого зайдите в личный кабинет. Генерация картинок и фотографий в Midjourne, Stable Diffusion, а также дополнительные функции по обработке изображений – это платные услуги; цена создания одной картинки начинается от 8 ₽.
Проект одноименной независимой исследовательской лаборатории под руководством бывшего инженера NASA сейчас тоже на стадии бета-тестирования. Как и остальные, Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.
Итоги
Luminar умеет находить и ретушировать людей (можно сгладить кожу, сделать глаза выразительней и заставить человека похудеть или потолстеть), может усилить боке на портретном фото, самостоятельно отыскав на нём человека и размыв фон. Есть удобный инструмент для автоматического удаления проводов с фотографий. Он не всегда справляется идеально, но большую часть проводов он находит и удаляет, экономя время фотографа.
Midjourney называют более художественной нейросетью (в противовес DALL·E — более реалистичной), с ее помощью можно создавать сложные арты, удивляющие креативностью. Попробовать можно бесплатно в Discord (для этого нужно выбрать любую комнату в разделе Newcomer rooms, написать в чате /imagine и в строке promt вписать описание картинки на английском; если не поняли, вот инструкция).
Есть на этом сайте и немного странный инструмент Reimagine XL. Работает он на основе нейросети Stable Diffusion и позволяет создать несколько нейросетевых вариантов загруженной картинки. При этом как-то контролировать процесс или подсказывать нейросети нельзя.
Программы от Topaz Labs умеют избавляться от шума, увеличивать размер изображения и спасать нерезкие фото. При этом, благодаря нейросетям, обученным на тысячах реальных фотографий, программы «знают», что скрывается за шумом и нерезкостью. В результате при восстановлении фотографии программы Topaz самостоятельно воссоздают детали, которые вообще отсутствовали из-за шума, маленького размера или нерезкости.
C помощью инструмента Relight можно поменять освещение на портрете — например, сделать свет более выразительным или добавить цветовые акценты. Нейросеть понимает, как устроена человеческая голова, и старается распределить падающий свет так, чтобы он выглядел анатомически верно.
По словам разработчиков, Imagine работает лучше, чем детище OpenAI. Но верить приходится на слово — проект находится на экспериментальной стадии (и непонятно, когда из нее выйдет). Пока можно ознакомиться с примерами работ, либо попробовать небольшое демо на официальном сайте (нам предлагают составить запрос из нескольких готовых шаблонов).
Luminar был одной из первых программ, позволяющих использовать искусственный интеллект и машинное обучение для обработки фотографий. Первые версии, вплоть до Luminar 4, работали неплохо, но требовали много ресурсов и могли вылететь во время работы. В следующей версии разработчики решили напомнить, что их приложение работает на основе искусственного интеллекта и назвали её просто Luminar AI (AI — artificial intelligence, искусственный интеллект). Ну а самая последняя версия программы называется Luminar Neo.
Её можно использовать, чтобы заменить лицо человека или перенести его в другое окружение, расширить изображение и дорисовывать края, перерисовать фото в виде картины маслом, кадра из аниме или диснеевскоо мультфильма. Можно даже обучить нейросеть на своих фотографиях и генерировать изображения с собой в виде киборга, героя фэнтези или мультика.