Нейросети

Нейросеть которая создает картинки по словам

11.05.2024

Содержание

9 крутых нейросетей, которые создают картинки по тексту

Анализ изображений

Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.

A MiXit logo is smashed by the MiXit logo cosmetics, foam, 4k, remarkable, professional realistic photo, photography, cinematic, photo, typography; v_model: v5 коробка детского питания с названием «TurboText kids» в красных и черных оттенках, на коробке изображена мама с дочкой, в стиле футуризма; style: realism, v5, height: 1280, width: 800 Donald Trump standing behind a American flag holding a sign with text Hello; v_model: v5 the inscription «COH» on the wall; v_model: v5 A Nike logo is smashed by the Adidas logo, 4k, remarkable; v_model: v5 A Nike logo is smashed by the Adidas logo, 4k, remarkable; v_model: v5 бутылка сидра с названием «Таня»; style: realism, v5, height: 1280, width: 800 логотип с названием «СТОЛОВАЯ», на котором изображены блюда европейской кухни, яркие цвета; v5, style: realism милый кот пьёт кофе за столом, уютная домашняя атмосфера, на заднем плане текст «Доброе утро TurboText»; v5

Еще одна программа, вдохновленная детищем OpenAI — ее создал энтузиаст из Техаса Борис Дайма для участия в конкурсе программистов. Сгенерировать картинку можно на сайте — вы получите сразу девять вариантов запроса не более, чем за две минуты. Правда, изображения в плане детальности уступают топовым проектам — нейронная сеть использует меньший набор параметров и обучена всего на 30 миллионах примеров, хотя создана на той же архитектуре, что и оригинальная DALL·E.

Не очень высокое качество отрисовки, тем не менее, не помешало проекту взорвать интернет. Довольно быстро появился форум на Reddit (сейчас там больше 100 тысяч подписчиков) и Twitter-сообщество (миллионник), где пользователи делятся самыми безумными вариантами генерации — нередко из них рождаются новые мемы (вот, например, Танос, который ищет свою маму в супермаркете Walmart, а вот Дарт Вейдер, попавший на камеру видеонаблюдения во время брейкданса).

Брейкданс Дарта Вейдера, падение астероида на Землю и животные в исторических костюмах — для искусственного интеллекта нет невозможного. Выбрали интересные проекты от Google, Сбера, NVIDIA и даже от бывшего инженера NASA, которые позволяют генерировать изображения по самым безумным описаниям — многие из них можно попробовать бесплатно.

По словам разработчиков, Imagine работает лучше, чем детище OpenAI. Но верить приходится на слово — проект находится на экспериментальной стадии (и непонятно, когда из нее выйдет). Пока можно ознакомиться с примерами работ, либо попробовать небольшое демо на официальном сайте (нам предлагают составить запрос из нескольких готовых шаблонов).

Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).

Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.

ЧИТАТЬ ТАКЖЕ: Когда выйдет искусственный интеллект

Imagine — главный конкурент DALL·E 2

Недавно бета-версия DALL·E 2 стала доступна онлайн — чтобы протестировать ее, нужно встать в лист ожидания и дождаться очереди. Если же хочется понять прямо сейчас, на что способны современные нейросети, составили подборку программ на базе ИИ, которые создают картинки по текстовому описанию. Одни из них идеально подходят для портретов, другие — для сюрреалистичного искусства и иллюстраций. Можете испытать их сами или посмотреть на картинки, которые сгенерировали мы.

Работает алгоритм не идеально — он ближе к уже устаревшей первой версии американской DALL·E. Однако это все еще самая сложная нейросеть в РФ. На ее тренировку ушло 24 тысяч GPU-дней — так называют произведение задействованных GPU (графических процессоров) и дней, которые ушли на обучение алгоритма (так, если вы используете 5 GPU и тренируете сеть 5 дней, потратите 25 GPU-дней).

роскошные розовые пионы в вазе; v_model: v1 роскошные розовые пионы в вазе; v_model: v2 роскошные розовые пионы в вазе; v_model: v3 роскошные розовые пионы в вазе; v_model: v4 роскошные розовые пионы в вазе; v_model: v5 ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v1 ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v2 ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: V3 ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v4 ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v5 красивая молодая женщина, платиновые волосы, без макияжа, черно-белый полосатый свитер, в темно-красных наушниках; v_model: v3 портрет Майкла Джексона в образе повелителя скелетов; v_model: v3 волчица с белым окрасом смотрит в объектив камеры в капюшоне; v_model: v3 Померанский шпиц бежит по весеннему лесу и улыбается, весёлая атмосфера; style: anime, v_model: v3 огненная пчела, пламя вулканической лавы переливается по всему телу пчелы, невероятные яркие цвета, фантастический сюжет на заднем фоне; v_model: v4, style: cinematic яблочный пирог; v_model: v3 Девушка с длинными кудрявыми рыжими волосами, веснушки на лице, натуральная кожа; height: 1024, width: 1024, v_model: v3

Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.

Проект одноименной независимой исследовательской лаборатории под руководством бывшего инженера NASA сейчас тоже на стадии бета-тестирования. Как и остальные, Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.

Midjourney называют более художественной нейросетью (в противовес DALL·E — более реалистичной), с ее помощью можно создавать сложные арты, удивляющие креативностью. Попробовать можно бесплатно в Discord (для этого нужно выбрать любую комнату в разделе Newcomer rooms, написать в чате /imagine и в строке promt вписать описание картинки на английском; если не поняли, вот инструкция).

9 крутых нейросетей, которые создают картинки по тексту

Анализ изображений

Imagine — главный конкурент DALL·E 2

ОСТАВЬТЕ ОТВЕТ Отменить ответ

ЭТО ПОПУЛЯРНО

ЭТО ИНТЕРЕСНО

ВЫБОР РЕДАКТОРА