Содержание статьи
Нейросеть Яндекса для генерации картинок — Шедеврум: насколько качественно и как этим пользоваться
Особенности приложения
На данный момент нейросеть находится в статусе бета-теста, поэтому объективно оценить её возможности будет сложно. По заявлениям разработчиков, при запуске проекта ИИ уже освоил массив данных из 200 миллионов изображений с описанием и продолжает обучение ещё на 500 миллионах картинок.
Чтобы воспользоваться «фильтрумами», нажмите плюсик на главном экране приложения и выберите один из них: каждый обозначен картинкой в меню. Если такая возможность не появилась, обновите «Шедеврум» до последней версии. А если и это не помогло, найдите в ленте пост, под которым стоит отметка «сделано в фильтруме», тапните на нее, а затем на поле «Использовать фильтрум».
Ключевое отличие «Шедеврума» от конкурентов в том, что это не просто сервис для генерации картинок, а полноценная соцсеть для нейрохудожников, напоминающая «Инстаграм». Здесь можно подписаться на пользователей, ставить лайки и оставлять комментарии под сгенерированными картинками. В сервисе также есть алгоритмическая лента, которая предлагает интересные посты.
В начале апреля этого года Яндекс анонсировали свою нейросеть для генерации изображений — «Шедеврум». Изначально доступ выдавался в порядке очереди, однако сейчас приложение может попробовать любой желающий, просто скачав его из маркета (Google Play или AppStore). В этом материале я кратко разберусь, что представляет из себя «Шедеврум», и соответствует ли его названию качеству работы.
Через минуту приложение выдаст текст и предложит выбрать к нему обложку. Отредактировать текст нельзя, можно только сгенерировать заново, при необходимости поправив запрос. За это отвечает иконка с карандашом. Можно добавить к тексту хэштеги или вовсе удалить результат.
В запросе лучше сразу указать действие, формат, сюжет или персонажа и стиль. Так результаты будут ближе к ожидаемым. Например, если просто написать в запросе «правило буравчика», нейросеть придумает историю про него или другой текст — всегда разный. А если конкретизировать — «объясни правило буравчика в физике так, чтобы понял пятилетний ребенок», — расскажет требуемое.
Что делают «фильтрумы»
Чаще всего к тексту будет предложено несколько вариантов обложки. Правда, они редко соответствуют написанному, хотя иногда перекликаются с запросом или заголовком текста. Откуда алгоритм берет предложенные изображения, неизвестно. Но если пролистать галерею до конца, будет возможность сгенерировать свой вариант картинки или опубликовать произведение без обложки.
Создатели проекта решили реализовать нейросеть в виде социальной сети. Идея не новая, и множество иностранных ресурсов, наподобие LeonardoAi или PlaygoundAi, уже имеют схожий формат, где генерируемые изображения с их описанием выстраиваются в пользовательскую ленту. Однако «Шедеврум» разместился не на сайте, а в мобильном приложении без какой-либо веб-версии, что делает его по-своему уникальным.
«Шедеврум» может не только генерировать картинки, но и стилизовать изображения, загруженные пользователем. Например, представить человека с фото в виде вязаной игрушки или сделать брутального кота романтичным. Для этого используют «фильтрумы» — обученные на конкретном стиле модели нейросети YandexART.
Различий в результатах в зависимости от языка нет. Но стоит помнить, что нейросеть обрабатывает запрос через перевод на английский. Это может быть важно, если у слов в запросе есть несколько вариантов перевода: «площадь» и «квадрат» — square, «ногти» и «гвозди» — nails. Результат может быть неожиданным.
Качество работы нейросетей — это всегда постепенный и длительный процесс улучшения. Проект достаточно экспериментальный, ведь конечная его цель неизвестна. Те же Leonardo или Playground служат не только в качестве хорошего инструмента генерации контента, но и поиска интересных идей для вдохновения с открытыми промптами. Мобильный формат нейросети не даёт возможности детальной работы с контентом, а значит удерживать пользователя придётся другими методами. Более конкретные выводы стоит делать уже после выхода полноценной и готовой для использования версии «Шедеврума».
«Шедеврум» генерирует качественные и детализированные изображения без артефактов на уровне предыдущих версий Midjourney или Stable Diffusion. Чем точнее вы опишите запрос, тем лучше получится результат: нейросеть хорошо следует промпту. Правда, настоящего фотореализма тут не добиться.
В отличие от большинства аналогичных сервисов, «Шедеврум» хорошо понимает русскоязычные запросы и учитывает их при генерации. «Фильтрумы» позволяют перерисовать изображение в одном из предустановленных стилей — например, сделать из фото картинку с вязаной игрушкой.
Результаты надо проверять, нейросеть активно галлюцинирует. Если вы пишете историю про приключения гусят, это некритично. А вот если просите что-то посчитать или объяснить, YandexGPT не предупредит, что не знает ответ и придумывает его на ходу.