Содержание статьи
Топ-10 нейросетей для обработки фото
Photoroom
В поле Prompt пишем просто «Burger on the plate» («Бургер на тарелке»). Stable Diffusion хорошо работает только с английским, так что тем, у кого с ним плохо, стоит вооружиться переводчиком. А тем, кто не уверен, что способен сформулировать промт самостоятельно, помогут библиотеки промтов — базы с набором проверенных запросов.
Runway — нейросеть, которая умеет анимировать фото по слоям (можно отдельно анимировать ближний, средний и дальний план) и превращать статичную картинку в видео. К тому же, платформа предлагает огромное количество функций по редактированию изображений (повысить качество, расширить границы, удалить фон и т.д.) и созданию их новых вариаций.
2. Mask mode — говорит нейросети, что же означает наша маска. По сути, это аналог белой или чёрной маски в Photoshop. В режиме Inpaint masked нейросеть будет изменять только то, что под маской, оставляя остальное нетронутым (как черная маска, частично протёртая). Ну а если выбрать Inpaint not masked, всё будет наоборот — область под маской останется неизменной, а всё вокруг поменяется (белая маска, частично закрашенная).
И, разумеется, Inpaint можно использовать для доработки сгенерированных нейросетью картинок, если в них не всё идеально. Если Stable Diffusion нарисовала вам человека, у которого что-то не так с лицом, или есть лишние пальцы на руках, это тоже можно поправить в этой вкладке. Нарисуйте маску в нужной области, и попросите нейросеть сгенерировать голову с открытыми глазами или руку с пятью пальцами — есть шанс, что она вас послушается и исправит недостатки.
Стоимость и тарифы. Основными инструментами нейросети можно пользоваться бесплатно , но с лимитами: создание изображений — 20 изображений в день, высококачественные изображения — 2 изображения в день, удаление фона — 5 изображений в день, ретушь изображений — 5 изображений в день, масштабирование изображений в день — 3 изображения в день.
Этот метод применим не только к фотографиям. Часто его используют, чтобы сделать несколько вариантов картинки, сгенерированной в той же Stable Diffusion. Для этого сгенерированная картинка загружается во вкладку img2img, и генерируется несколько вариантов с теми же ключевыми словами, что и исходная.
Ideogram упрощает процесс создания визуального контента и позволяет юзерам создавать оригинальные изображения, правильно вводя текстовые подсказки. Помимо самостоятельной генерации, можно воспользоваться библиотекой нейросети, в которой собраны работы других пользователей доступные к переиспользованию или скачиванию.
Этот ИИ-редактор поддерживает функции вышеупомянутых нейросетей, поэтому он подходит для решения простых задач (обрезка, изменение яркости и т.д.). Но также в нём доступны и другие функции, нацеленные на более сложные манипуляции с фото. Например, ИИ-обмен лицами, шаблоны для оформления соцсетей и печатной продукции. К тому же, в Pixlr есть простенький генератор ИИ-изображений .
Pixlr
До массового распространения нейросетей для обработки фото многие из базовых задач, такие как удаление фона или ретушь изображений, приходилось решать в Photoshop и других аналогичных программах. Это занимало значительно больше времени и требовало глубокого изучения функционала того или иного софта. Кроме того, качество результата напрямую зависело от навыков и опыта дизайнера.
4. Batch count — количество одновременно генерируемых изображений. На мощной видеокарте уровня RTX 4090 можно генерировать по 8 (или даже 12-16) изображений за раз, это занимает пару минут. На слабой видеокарте с 4-6 Гб памяти лучше поставить от 2 до 4, чтобы не ждать слишком долго.
С помощью Runway можно создавать презентации, короткометражки и другие мультимедийные креативы. Эта нейронка интегрирована с другими сервисами и программами (Adobe Photoshop, Unity и т.д.), поэтому работа в ней подойдёт как специалистам, так и обычным юзерам, которые хотят расширить свои творческие возможности.
Слева вверху — оригинальный бургер с фотостока. Справа от него наш красивый бургер с Denoising strength 0,3. Он стал более аккуратным, словно над ним поработал ретушёр, но при этом общая композиция очень похожа на оригинал. При Denoising strength 0,55 бургер стал менее фотореалистичным, начинка немного поменяла вид (как и задний план — вместо стены теперь какой-то размытый интерьер). Ну а при 0,88 тарелка посинела, ракурс изменился и из бургера исчезла одна из котлет и сыр. Зато появилась картошечка.
В запрос, как всегда при работе с img2img, подставляем самые простые понятия. Например «woman face». Жмём на кнопку Generate и ждём. В зависимости от мощности видеокарты генерация 8 изображений займёт от 30-40 секунд до 15-20 минут. И вот наш результат: слева исходное фото с маской, справа — девушка со свежесгенерированной головой.
Обратите внимание, что в отличие от генерации картинки только по текстовому описанию, нам не нужно создавать очень сложный набор ключевых слов. Вместо того, чтобы словами говорить нейросети о размерах бургера, количестве сыра и котлет и цвете тарелки, мы просто показываем ей образец и говорим, что хотим бургер. Генерируем и выбираем самый красивый.