Содержание статьи
Вы наверняка слышали про нейросеть, которая может сама дорисовывать картинки в фотошопе Показываем, как попробовать ее бесплатно — в том числе из России. Это очень легко (некоторые считают, что даже слишком)
NightCafe
Я попробовал режим на примере Шрека — изобразил его в киберпанк-стиле. Сервис неплохо дорисовал тело зеленого огра, сохранив его особенности и детали одежды. А вот лес c оригинального кадра стал проблемой, в итоге он сильно выделяется на фоне типичного киберпанк-города. Хотя нейросеть попыталась обыграть деревья, превратив их в странную зеленую сферу.
Lexica — буквально библиотека, в которой хранятся миллионы изображений, созданных нейросетью Stable Diffusion и собственной моделью сервиса — Lexica Aperture. Можно нажать на любую работу и увидеть использованный при ее создании промт и выбранную модель. Это хорошая возможность вдохновиться и усовершенствовать собственные запросы для нейросетей. Или не создавать свои картинки, а найти похожие в базе.
Дорисовка — тоже инструмент, который есть далеко не во всех сервисах. Работает это так: вы генерируете или загружаете картинку, а затем уменьшаете ее так, чтобы поле генерации было больше изображения. Потом дописываете текстовый запрос или выбираете стиль, после чего нейросеть будто дорисовывает картинку. Такая возможность есть только на fusionbrain.ai, в ботах ее нет.
Так я несколько раз менял человека в красном пальто на улице киберпанковой Москвы. Нейросеть очень четко работала по контуру и не искажала остальное изображение. Это действительно полезный инструмент. Он доступен только если пользуетесь «Кандинским» на сайте fusionbrain.ai.
Перенос стиля позволяет задавать дополнительные входные условия — позу персонажа и очертания исходной картинки. Можно взять фото человека, прогнать его через нейросеть и заменить только внешность с сохранением остальной композиции. Функция доступна только в телеграм-боте.
Проблемой фейков озабочены и сами разработчики. В 2019 году Adobe совместно с New York Times и Twitter создала Content Authenticity Initiative. В 2021-м к организации присоединились представители «Би-би-си», Intel, Microsoft и других компаний. Задача проекта — внедрение технических стандартов и цифровых подписей, которые позволят определять надежность текстов и изображений. В частности, о том, что контент сгенерирован искусственно, будет говориться в метаданных файлов. Еще одна важная инициатива Adobe — Content Credentials («удостоверение контента»). В официальном заявлении после анонса Firefly говорилось, что каждое изображение, отредактированное с использованием нейросети, содержит соответствующее указание в метаданных. Конечно, подобную предосторожность легко обойти, просто сделав скриншот изображения (как мы поступили в этом материале, о чем честно предупреждаем!).
В интернете уже появилось множество руководств по использованию нейросети (особенно в ютьюбе), а также примеров отредактированных фотографий в стиле было/стало. Пользователи опробовали генеративную заливку на самых разных изображениях, от пейзажных снимков и популярных мемов до обложек культовых альбомов и «Моны Лизы». В твиттере дизайнеры показывают, насколько ускорилась их работа благодаря нейросети.
Для многих основной барьер при работе с нейросетями — знание английского языка для текстовых описаний. Нейросеть от Сбера решает эти проблемы: она хорошо понимает русскоязычные команды. Если предыдущие версии Kandinsky уже сильно устарели, то новая приближается по уровню генерации и стилистике к Midjourney v5 — это отличный уровень.
Где попробовать нейросеть Kandinsky 2.2
Но доступ к телеграм-боту с этой функцией есть только у некоторых активных пользователей, остальным возможность создавать видео обещали дать до конца 2023 года. Пока же можно подать заявку в боте и посмотреть примеры на сайте проекта. Заявки рассматривают с разной скоростью: одному редактору Т—Ж дали доступ за неделю, а другому не ответили за две.
Чтобы попробовать нейросетевую функцию, нужно выделить часть изображения. Для этого можно воспользоваться одним из нескольких инструментов. Самый простой из них — выделение прямоугольником или овалом. Варианты инструментов выскакивают при нажатии правой кнопкой мыши.
Сайт устроен как тематическая соцсеть: там доступны и чужие работы, чтобы вдохновиться или подсмотреть наиболее эффективные запросы. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать, выполняя разные задания: например, посмотреть рекламу или поделиться работой в соцсетях. Каждый день можно получить пять бесплатных кредитов, этого достаточно для генерации 25 изображений без водяных знаков.
Управлять результатами смешивания картинок можно в «Профессиональном режиме», если выбрать в меню телеграм-бота соответствующий пункт или ввести команду /profmode. Тогда бот предложит выбрать влияние каждой из исходных картинок на результат. По умолчанию — 50:50 , еще доступны варианты 30:70 и 70:30 .
Шестая версия нейросети создает максимально фотореалистичные изображения. Характерные для ранних поколений проблемы с глазами или руками, по которым отличали сгенерированные картинки, почти ушли. Язык запросов становится все более естественным: можно просто описать, что хотите получить, или даже попросить передать какую-то эмоцию.
Другой вариант — запустить нейросеть через Google Colab, сервис для использования чужих вычислительных мощностей. Проблема с этим вариантом в том, что Google часто блокирует колабы со Stable Diffusion, считая нейросеть нецелевым использованием сервиса. Тем не менее колабы от некоторых сервисов, например Fooocus, еще работают.
Другая проблема — это копирайт. Нейросеть Firefly обучалась на 300 миллионах изображений и видео из фотобанка Adobe Stock, находящихся в общественном достоянии. Компания утверждает, что сделала все возможное, чтобы не нарушить авторские права. Тем самым планируется избежать судебных исков, которые были поданы, в том числе против создателей Midjourney. Если же на компании, которые использовали Firefly, все-таки подадут в суд за нарушение копирайта, Adobe пообещала возместить им убытки. Все вопросы это, конечно, не решит. Журнал Forbes приводит мнения пользователей, разместивших свои работы на Adobe Stock. Они обнаружили, что не могут поменять условия лицензионного соглашения и помешать Firefly в дальнейшем эти изображения использовать.
Сейчас доступно около двадцати стилей, список и количество время от времени меняются. Набор обычен для аналогичных сервисов: киберпанк, аниме, карандашный рисунок, традиционная живопись. Из нестандартных отдельным пунктом значится хохлома. Иногда со списком стилей экспериментируют, например добавляют «Советские мультфильмы» или «Новый год». Это не что-то уникальное: с самыми известными стилями русских народных промыслов и художников знакомы и англоязычные приложения.
Craiyon
Я попробовал смешать Шрека с Райаном Гослингом из «Бегущего по лезвию». Получилось неплохо: Kandinsky 2.2 скопировал стилистику и выражение лица Гослинга, но сохранил узнаваемые черты Шрека. Есть и недостаток: никак нельзя повлиять на результат генерации — к примеру, установить процент заимствования. Вы просто загружаете две картинки и ждете результата.
В актуальной версии «Шедеврума» картинки получаются без лишних артефактов, детализированными и разнообразными. Фотореалистичность, как правило, уступает Midjourney, но в других стилях арты получаются очень качественными. «Шедеврум» хорошо понимает запросы на русском и полностью бесплатен.
Где попробовать: сайт
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨👨🎨👨🎨
Фан-эффект: 😎😎😎😎😎
Язык: английский
Стоимость: бесплатно 100 картинок в неделю, больше и быстрее — от 8 $ ( 750 ₽) в месяц
Самый простой способ попробовать Stable Diffusion — на официальном сайте Stability AI, который называется Clipdrop. Турборежим позволяет быстро сгенерировать набросок низкого качества. Его можно переделывать неограниченное количество раз, пока композиция в целом не устроит. А затем по понравившемуся эскизу сгенерировать более детальное изображение через меню Edit → Reimagine.
Главная особенность сервиса в том, что он работает с русским языком и генерирует приближенные к фотореализму картинки. Можно описать изображение, задать стилистику, уточнить детали. А еще нейросеть умеет генерировать короткие анимационные ролики. В отличие от многих аналогичных сервисов, Kandinsky 2.2 неплохо понимает русскоязычные запросы и учитывает их при генерации.
Нейросеть понимает запросы на русском языке, хотя с английским результат может быть лучше. Фотореализм — не самая сильная сторона Dall-E , здесь сервис уступает Midjourney. Зато можно добиться более точного соответствия промпту при нестандартных запросах, когда хочется изобразить что-то , чего в реальности нет. Для тех, кто не определился, что хочется увидеть, есть кнопка «Удивите меня» — ИИ предложит свои варианты.
Где попробовать: в чате с ChatGPT (сайт недоступен из РФ)
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨👨🎨👨🎨👨🎨
Фан-эффект: 😎😎😎😎😎
Язык: русский, английский и десятки других
Стоимость: от 20 $ ( 1800 ₽) в месяц
Bing Image Creator — самый простой способ попробовать нейросеть Dall-E от OpenAI. Microsoft внедряет нейросетевых помощников во все свои сервисы, от поиска до ассистента Copilot в Windows 11 и кнопки для генерации картинок Cocreator в Paint. Для их использования нужен аккаунт Microsoft, а в России — еще и VPN.