API документация
Заключение
Метод check_status позволяет проверить статус генерации изображения. Для вызова этого метода необходимо отправить GET запрос на URL /key/api/v1/text2image/status/ , где uuid — идентификатор задания, полученный при вызове запроса к модели.
Первое что нужно сделать, так это начать с ввода текстового запроса (промпт’а), описывая, что именно вы хотите увидеть на своем будущем изображении. Например, вы можете написать: «Летящий дракон над горой». Кстати, промпт также можно писать на русском языке. Но в любом случае дам совет, если нейросеть вас не будет понимать, попробуйте написать промпт на английском языке. Переводчик (Яндекс или Deepl) в помощь.
Стиль играет важную роль в создании изображений. Разные стили придают работам различные характеристики и эмоции. Вы можете экспериментировать с разными стилями, чтобы найти идеальное сочетание для вашего проекта. Например, тот же запрос в другом стиле (см. на скриншот ниже).
Отличная, кстати вещь. Одна из немногих нейросетей, которая смогла мне по простому запросу создать кроссовый мотоцикл. А это очень сложная задача, особенно колеса со спицами.
А еще эту нейросеть использовал для создания фона для игры на некоммерческой основе. Вручную рисовать фон долго и умеет не каждый, а тут подобрал несколько вариантов и подредактировал уже готовое, убрал лишние детали, швы удалил и сделал бесшовными (Кандинский не умеет в бесшовность).
—
Но есть нюанс. Например, я набираю запросто «чистое небо», что бы без облаков и всяческой дряни. Так нейросеть эта обязательно воткнет в это самое небо какой-нибудь идиотский объект.
Или я создал несколько изображений и собираюсь их «объединить», стираю лишнее и вношу запрос на обычный фон, что бы нейросеть просто «спаяла» картинки. Ага, фига лысого! Нейронка шибко умная и вместо удаления шва вносить какой-нибудь абстрактный объект, хотя никто об этом ее не просил. Постоянно с этим борюсь.
Добавление своих объектов работает из рук вон плохо до сих пор. Собственно на примере с котенком вы видете, что делает нейросеть с бедным животным. Как бедного котика размазало, живодерное ПО!
Еще у нейросети частенько бывает сбой. На некоторых картинках создаются светлые полосы. Как будто бы туман, но в только с краю изображения. Приходится стирать и заново писать более подробный запрос.
—
Но несмотря на эти минусы — отличный инструмент. Можно сгенерировать какой-либо фон, который можно использовать без привязки к копирайтам.
—
ПС: в самой нейросети есть режим «цифровая живопись». На многих создаваемых изображениях в правом углу наблюдается объект, который при рассмотрении напоминает тег художника. Откуда бы такое появлялось, если бы нейросети не учились на уже существующих работах?
Нужна была иллюстрация, на которой из обгрызанного красного яблока вылезает червяк и с некоторым недоверием смотрит на стоящего рядом зелёного андроида. В лучшем случае этот Brain рисовал мне красного C3PO и зелёного R2D2. А червяка или игнорировал вообще, или рисовал не там, где я его просил. Может, конечно, за месяц что-то изменилось. Проверю на днях.
Как вы можете видеть на скриншоте ниже, я выбрала стиль «Киберпанк», формат квадрат (1024х1024 пикселей). Здесь у вас есть возможность дополнительно настраивать стиль или параметры и создавать неограниченное количество изображений на основе вашего исходного запроса.
Процесс создания изображений на примере
API Kandinsky для создания уникальных изображений предоставляет удобный способ генерации реалистичного контента для ваших продуктов и сервисов. Следуя инструкциям в этой документации, вы можете легко интегрировать API в свой проект. Если у вас есть вопросы или предложения, пожалуйста, свяжитесь с нами по адресу hello@fusionbrain.ai.
Главная цель Fusion Brain — превращать ваши текстовые описания в изображения. Эта нейросеть, также известная как «Кандинский 2.1», которую разработал компания Сбер. Сейчас мы познакомимся с Fusion Brain, рассмотрим, какие у него возможности и как использовать его для создания изображений.
При большой нагрузке или технических работах сервис может быть временно недоступен для приема новых задач. Можно заранее проверить текущее состояние с помощью GET запроса на URL /key/api/v1/text2image/availability . Во время недоступности задачи не будут приниматься и в ответе на запрос к модели вместо uuid вашего задания будет возвращен текущий статус работы сервиса.
Метод generate принимает текстовое описание изображения в качестве входных данных и генерирует соответствующее ему изображение. Для вызова этого метода необходимо отправить POST запрос на URL /key/api/v1/text2image/run .
После ввода запроса и выбора стиля нажмите на кнопку «Создать», и Fusion Brain начнет обработку вашего запроса, используя его для генерации изображения. Время обработки запроса может варьироваться, но обычно результаты готовы всего за несколько секунд или минут.
Где почитать про эти гребаные инструменты? Почему невозможно создать картинку мальчика, указывающего на себя? Куда угодно показывает пальцем. только не на себя! Когда изменила запрос на конкретное «Показывает указательным пальцем себе на грудь», система выдала, что это противоречит инструментам нейросети!