Содержание статьи
Нейросети для рисования: 12 лучших сервисов для генерации изображений
Kandinsky 3.0
Сервис позволяет выбрать разрешение сторон, а также задать промпт, то есть что должно быть на картинке, и негативный промпт — чего быть не должно. В поле с запросом можно развернуть список подсказок: нейросеть предложит варианты для каждой значимой части запроса. Например, сгенерировать не только Бэтмена в Москве, но и Супермена в Токио.
Нейросеть понимает запросы на русском языке, хотя с английским результат может быть лучше. Фотореализм — не самая сильная сторона Dall-E , здесь сервис уступает Midjourney. Зато можно добиться более точного соответствия промпту при нестандартных запросах, когда хочется изобразить что-то , чего в реальности нет. Для тех, кто не определился, что хочется увидеть, есть кнопка «Удивите меня» — ИИ предложит свои варианты.
Крупноформатная видео-открытка — комплексный проект из нескольких этапов, который рушит грань между цифровым миром и реальностью. Инициатива удивляет глубиной и сложностью технологического подхода. Для создания необычного видео понадобились 50 реальных женщин, 8 фотографов, 6 визажистов, 5 дизайнеров, 2 фотостудии и 2 видеооператора. А ещё — 2 медиахудожника, которые объяснили искусственному интеллекту — нейросети Stable Diffusion (18+) — как нужно увидеть и преобразить женщину.
При подготовке фотографий, на базе которых будет происходить обучение нейросети, требования к макияжу тоже специфичные. И не всем женщинам они подошли. Оказалось, что подчеркнуть контуры лица необходимо только с помощью нюдового макияжа. Яркий мейкап просили смыть. Студия SHUM поделилась советами, как создать фотографии для обработки искусственным интеллектом:
Это нейросеть от Stability AI с открытым исходным кодом — любой может бесплатно установить Stable Diffusion на свой компьютер. Но для этого нужно мощное железо и технические навыки. Начать пользоваться нейросетью несколько сложнее, чем другими, но, если разобраться, с ее помощью можно создавать практически любые изображения.
Есть мнение, что искусственная нейросеть — настолько мощный интеллектуальный инструмент, что он способен заменить представителей творческих индустрий. По команде она рисует и обрабатывает картинки, пишет тексты и программные коды, сочиняет музыку и даже преподаёт научные дисциплины — казалось бы, выполняют функции дизайнеров, копирайтеров, программистов, диджеев, учителей и т.д. Например, месяц назад один из студентов Российского государственного гуманитарного университета (РГГУ) написал и даже защитил дипломную работу с помощью нейросети ChatGPT (18+).
Dall-E 3
Нейросеть от OpenAI работает в мультимодальном режиме: в одном чате можно беседовать текстом, отправлять и получать картинки, отправлять файлы и другие материалы. Сервис проанализирует их и учтет так же , как и текстовые запросы. Это позволяет, например, показать нейросети изображение и попросить нарисовать такое же , только с нужными вам изменениями. Уровня фотомонтажа получить пока не удастся, но большую часть творческих идей воплотить реально.
Если видеокарты с такими характеристиками нет, а попробовать Stable Diffusion все равно хочется, то можно использовать браузерную версию генератора. Вот только качество изображений в таком случае будет хуже, чем в релизной версии. Все это бесплатно: открытая лицензия позволяет использовать модель в коммерческих и некоммерческих целях.
Где попробовать: в чате с ChatGPT (сайт недоступен из РФ)
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨👨🎨👨🎨👨🎨
Фан-эффект: 😎😎😎😎😎
Язык: русский, английский и десятки других
Стоимость: от 20 $ ( 1800 ₽) в месяц
Техническая начинка медиаэкранов MAER позволила чётко и без искажений передать даже мелкие детали насыщенного креатива. Происходит это за счёт большого количества пикселей, из которых состоит экран. Например, разрешение одного из 3D-медиафасадов MAER в Москве — на ул. Велозаводской, 13, стр.2 — 3008х960 пикселей, что почти вдвое больше, чем стандартное разрешение медиафасадов. Передать видеоконтент в приятном для зрительского восприятия формате помогли оптимальные яркость, контраст, широкий угол обзора, а также качественная цветопередача — более 16 млн цветов.
Однако, предупреждают художники SHUM, не все так просто. На сегодняшний день нейросеть может создавать качественный контент лишь в соавторстве с человеком, который будет её обучать и контролировать. Это подтвердил и сам студент РГГУ, который подробно и поэтапно ставил ИИ задачи по составлению дипломного плана и содержанию глав. Заметим, что нейросеть, которую он использовал, заблаговременно уже была обучена разработчиками и пользователями: пропустила через себя огромный массив текстов из всех областей знаний, от классической литературы до ядерной физики.
После подготовки нейро-открытки на компьютере студии SHUM ее увидели на экранах страны. Дизайнеры медиахолдинга MAER адаптировали видео под крупноформатные рекламоносители, отличающиеся разнообразием форм и размеров. Нейро-открытка создала праздничное нестроение в Москве, Екатеринбурге, Волгограде, Новосибирске, Челябинске, Нижним Новгороде, Перми, Уфе, Самаре, Тюмени и т.д. Её увидели миллионы.
«Нюдовый» этап
Для многих основной барьер при работе с нейросетями — знание английского языка для текстовых описаний. Нейросеть от Сбера решает эти проблемы: она хорошо понимает русскоязычные команды. Если предыдущие версии Kandinsky уже сильно устарели, то новая приближается по уровню генерации и стилистике к Midjourney v5 — это отличный уровень.
Конечно, технология генерации дипфейков существует уже достаточно продолжительное время. Но Stable Diffusion представляет совершенно новое поколение систем, которые могут создавать невероятно убедительные дипфейки с минимальной пользовательской работой. Программа легко установлена, для этого не требуется особых знаний или навыков. Кроме того, разработчики ведут постоянную работу над оптимизацией своего софта, что в теории лишь увеличит его доступность.
Художники студии SHUM столкнулись с проблемой почти сразу: если какой-то портрет не отвечал заданным параметрам, то нейросеть вместо женского облика выдавала «карикатуры». Пришлось обучать нейросеть учитывать особенности каждого лица, неровность света, и т.д. Процесс обучения был достаточно нестабилен, и это главная сложность этапа.
В сервисе есть собственный набор ИИ-инструментов , чтобы увеличить разрешение картинки, убрать фон или заменить его на хромакей, сделать черно-белое фото цветным или удалить с него какие-то объекты. Все это работает и со сгенерированными здесь же изображениями, и с загруженными пользователем. Причем часть инструментов не расходует кредиты.
Этап обработки фотографий с помощью нейросети состоял из нескольких подготовительных ступеней. На первой — необходимо было подготовить фотографии (подогнать под определенный формат, выровнять экспозицию, сделать минимальную ретушь), на второй — слить все фотографии в единый образ (обучить нейросеть на подготовленном датасете), на третьей — приступить к художественной обработке.
Чтобы создавать картинки, присоединитесь к серверу Midjourney в Discord, ознакомьтесь с правилами сообщества и оплатите подписку. Дальше нужно либо добавить бота Midjourney на свой сервер, либо генерировать в одном из общих чатов. Для этого достаточно ввести команду /imagine и сформулировать запрос на английском языке. Сервис создаст четыре варианта, у каждого можно увеличить разрешение или попросить нейросеть переделать в том же духе. Возможность генерировать картинки прямо на сайте Midjourney вводят постепенно.