Содержание статьи
Кандинский»: как пользоваться нейросетью «Сбера»
Чем GigaChat отличается от других нейросетей
«Кандинский» конкурирует не только с Midjourney: есть и другие ИИ для генерации картинок, в том числе и бесплатные. Попробуем сравнить, как разные сервисы справятся с рисованными и с фотореалистичными иллюстрациями. Возьмём два изображения Midjourney и попробуем повторить их запросы. По возможности будем выбирать подходящую стилистику в меню каждого редактора.
«Сбер» выпустил свою первую нейросеть для генерации картинок ещё в 2021 году ― она называлась ruDALL-E. Её обучали на миллиарде связок «текст ― изображение». «Кандинский» унаследовал весь этот багаж знаний и прошёл дополнительное обучение ― на новом датасете из 170 млн пар «текст ― изображение». Нейросеть выпустили летом 2022 года, с тех пор уже вышло два обновления: в ноябре 2022 года и в апреле 2023-го.
Если нужно изображение другого размера или формата, нейросеть может достроить своё сгенерированное изображение. Для этого надо сначала создать картинку 768×768 px, а потом подвинуть рамку. «Кандинский» заполнит всё пустое пространство в рамке с учётом исходного сюжета.
По центру ― область для будущего изображения. По умолчанию размер 768×768 px, но его можно уменьшить с помощью фиолетовой рамки. В нижнем левом углу можно выбрать стиль изображения. По центру под этой рамкой ― область для промпта, там же и кнопка «Создать». А скачать получившееся изображение можно с помощью кнопки в верхнем правом углу.
Ещё несколько функций редактора можно найти в меню в левом верхнем углу. Например, если нажать на иконку с картиной, можно добавить референс. Нейросеть не может значительно изменять загруженные картинки, но может заполнить пустое пространство вокруг. Для этого оптимально подходят картинки в PNG с прозрачным фоном.
ГигаЧат работает в окне браузера, интерфейс очень похож на ChatGPT. В центре находится диалог, внизу поле, куда пользователь вводит запросы. На боковой панели находится история диалогов с нейросетью, их нельзя удалить. Но если вы хотите начать Новый чат с GigaChat — нажмите на соответствующую кнопку, диалог начнётся сначала.
Каждый ответ нейросети можно оценить пальцем вверх или вниз, рядом кнопка для повторной генерации ответа по тому же запросу. GigaChat умеет отвечать на вопросы. Поэтому мы тут же спросили его о сервисах Callibri. Нейросеть не смогла ответить точно, хотя пошла в верном направлении, поэтому мы дали ей дополнительный ориентир. И начались проблемы. Не знает. Спустя пару вопросов мы сломали нейросеть. Она сказала, что не знает компании из других городов, подразумевая Екатеринбург, но в следующем вопросе указала на Екатеринбург как область своих знаний. Поймав нейросеть на лжи, мы получили вот такое оправдание. Продолжаем развивать тему. Раз GigaChat не знает о Callibri, мы попросили узнать. Ответ, что называется, убил:
Повторная генерация не помогла, нас всё равно попросили подождать. ГигаЧат не справился с этим вопросом. Мы решили спросить у нейросети про одного из наших крупных конкурентов, думая «Ну они больше, может их нейронка знает.». Нет, эту компанию искусственный интеллект вообще считает сервисом такси: А когда мы тонко намекнули, что нейросеть ошиблась, она гордо заявила, что уверена в ответе. В том числе и после повторной генерации ответа: Напоследок мы решили сами рассказать нейросети о сервисах Callibri. Она поняла, но не запомнила 🙁 Надеемся, что в будущем GigaChat сможет рассказать, что мы делаем коллтрекинг и другие полезные сервисы для маркетологов и бизнеса.