Содержание статьи
Сначала будет слово: как давать задания нейросети Kandinsky 2.2
Как пользоваться функциями Kandinsky 2.2
Мы не будем углубляться в детали регистрации и технических настроек, эту информацию можно легко найти в общем доступе во многих источниках. Расскажем непосредственно о процессе создания промта. Простыми словами, промт — это запрос в свободной форме или состоящий из ключевых слов и технических команд, по которому нейросеть генерирует изображение или другой контент.
Выберите объект. Это может быть все, что угодно: человек, животное, сказочный персонаж, город, пейзаж, здание, автомобиль и любой другой физический объект. Укажите число объектов, но помните, что чем их больше, тем менее детализированными они будут. Пробуйте совмещать два объекта, например, «киберпанк-город» или «кот, похожий на картину “Мона Лиза”». Это позволит вам получить яркий и необычный концепт.
Если проект включает в себя разработку пользовательского интерфейса, следует описать, что должен включать в себя интерфейс и какие принципы необходимо учесть. Если проект связан с обработкой конфиденциальной информации, непременно следует описать, какие меры безопасности должны быть приняты.
Изображения, сгенерированные нейросетью, можно использовать для иллюстрации статей в медиа и блоге компании, а также в презентациях, рассылках и соцсетях бренда. Картинки можно применять в дизайне (создание логотипа, упаковки, шапки сайта, UX-дизайна кнопок, одежды, обложек для трека, музыкального альбома или книги), рекламе и маркетинге (создание баннеров, рекламных иллюстраций, изображений для интернет-витрин).
Также вы увидите ряд команд в две строки. Первая строка — U1, U2, U3, U4 — это масштабирование фотографии. Цифра — это номер фотографии, которую необходимо увеличить. Вторая строка — V1, V2, V3, V4 — это создание новых экземпляров на основе версии фотографии. Если вам понравилась фотография, вы можете сделать еще четыре экземпляра на ее основе.
Сбер представил новую версию своей нейросети — Kandinsky 2.2. Она создает фотореалистичные изображения с более высоким разрешением и разным соотношением сторон. Рассказываем, что умеет Kandinsky 2.2 и как правильно составлять промпты — текстовые задания для нейросети.
После ввода команды /imagine и описания деталей нажмите Enter или отправьте сообщение. Это отправит ваш запрос боту Midjourney, который начнет генерировать изображения на основе вашей подсказки. Боту может потребоваться несколько минут, чтобы выполнить ваш запрос, так как ему необходимо обработать информацию для генерации.
Ответы нейросети необходимо сначала критически оценить и, возможно, переработать. Маркетолог, копирайтер, дизайнер должны знать, что это всего лишь вспомогательный инструмент, который поможет ускорить работу на первом этапе, но вряд ли полностью решит задачу.
Примеры ТЗ для разных тем в маркетинге
Очевидно, что качество изображения и способности отрисовки у Midjourney выше, чем у Kandinsky 2.1, например. И каким бы подробным ни было ТЗ, степень обученности нейросети играет большую роль. Но у Midjourney уже вышла пятая версия, а у Kandinsky пока что только вторая, поэтому все еще впереди.
Смешивание. Есть два варианта — «смешивание картинок» и «смешивание картинки и текста». В «смешивании картинок» отправьте основное изображение первым, а вторым — изображение с необычным стилем. Первое изображение приобретет дополнительные элементы из второго, которые сделают итог более красочным.
Не используйте слова, выражающие отрицание («не», «кроме», «без», «за исключением», «никакой»), и деепричастные обороты. Нейросеть не поймет их, в результате вам придется переформулировать запрос. Для работы с негативным промптом используйте отдельную функцию «изменить негативный промпт» и напишите, что не хотите видеть на изображении: например, «тусклые цвета», «текст».
Колоссальный прорыв, изменивший видеопродакшен, стал возможен только благодаря нейросетям. А сможет ли искусственный интеллект оставить без работы монтажеров и звукооператоров? Пока что нет. Несмотря на невероятные результаты, у искусственных нейронных сетей есть одно существенное отличие от человека — результат их работы пока случаен.
Если вы попросили увеличить понравившийся вариант, то можете увидеть дополнительные настройки. Make Variations — создать вариант увеличенного изображения и новую сетку из четырех вариантов. Beta / Light Upscale Redo — повторить масштабирование с использованием другой модели масштабирования. Web — открыть изображение в своей галерее на Midjourney.com.
Это нейронная сеть, которая моделирует обратный диффузионный процесс (поэтому часто ее так и называют — диффузионная модель). Из случайного изображения шаг за шагом получается все более и более красивая и реалистичная картинка (а самое главное — отражающая то, что вы попросили нарисовать текстом).
Первым делом необходимо определить цель проекта и желаемый результат. Чем конкретнее будет цель, тем легче нейросети будет выполнить задачу. Опишите требования к функциональности и характеристикам результата, а также укажите ограничения и условия проекта. Это может включать в себя ограничения по времени, бюджету, доступу к данным и т. д.
Для генерации изображения нужно составить промпт — текстовое описание, которое обычно состоит из нескольких ключевых слов. По этому запросу нейросеть создаст картинку. Основное правило — слова в начале промпта имеют больший вес, чем те, которые расположены в конце.