Содержание статьи
9 крутых нейросетей, которые создают картинки по тексту
Нейросеть генерирует фото
Теперь позвольте мне объяснить, как это стало возможным. На сцену выходят нейронные сети, технологические марионетки, кукловодами которых мы являемся. Нейронные сети для изображений — это своего рода «мозги» искусственного интеллекта. Они создаются в образе и подобии человеческого мозга, пытаясь повторить его способность учиться и адаптироваться.
Не очень высокое качество отрисовки, тем не менее, не помешало проекту взорвать интернет. Довольно быстро появился форум на Reddit (сейчас там больше 100 тысяч подписчиков) и Twitter-сообщество (миллионник), где пользователи делятся самыми безумными вариантами генерации — нередко из них рождаются новые мемы (вот, например, Танос, который ищет свою маму в супермаркете Walmart, а вот Дарт Вейдер, попавший на камеру видеонаблюдения во время брейкданса).
Так что этот генератор изображений нейросети — идеальный инструмент для каждого, кто хочет погрузиться в мир цифрового искусства. Он прост, он доступен, и, что самое важное, он способен порождать креативные вспышки, которые могут вдохновить на создание удивительных произведений искусства.
Совместное использование этих технологий позволило нам пересекать границу между словами и изображениями, между описаниями и визуализациями. Мы передаем нейросети описание, и она, словно художник, берет свой виртуальный кисть и начинает рисовать. В результате описания превращаются в яркие, полноцветные изображения, созданные нейросетью.
Таким образом, несмотря на сложность задачи, рисование фото по словам и запросам нейросетью обретает простоту и понятность. Ведь, для того чтобы воплотить описание в изображение, нам не нужно быть художниками. Все, что нам нужно, это сформулировать свою мысль и довериться магии нейронных сетей.
Искусственный интеллект для фото стирает границы между тем, что было сотворено природой, и тем, что было создано человеком. Веками мы пользовались кистью и холстом, чтобы создавать изображения, потом пришли фотоаппараты, и теперь — нейросети. Невероятная мощь современных вычислительных систем позволяет моделировать мир внутри машины, с широкой палитрой оттенков, форм и деталей.
Midjourney называют более художественной нейросетью (в противовес DALL·E — более реалистичной), с ее помощью можно создавать сложные арты, удивляющие креативностью. Попробовать можно бесплатно в Discord (для этого нужно выбрать любую комнату в разделе Newcomer rooms, написать в чате /imagine и в строке promt вписать описание картинки на английском; если не поняли, вот инструкция).
По словам разработчиков, Imagine работает лучше, чем детище OpenAI. Но верить приходится на слово — проект находится на экспериментальной стадии (и непонятно, когда из нее выйдет). Пока можно ознакомиться с примерами работ, либо попробовать небольшое демо на официальном сайте (нам предлагают составить запрос из нескольких готовых шаблонов).
Создать фото по описанию
Наконец, генератор изображений нейросетью обладает непредсказуемым креативным потенциалом. С его помощью можно создавать изображения, которые никогда не возникнут в человеческом воображении. Это не только инструмент, но и муза, которая вызывает в нас новые идеи и поддерживает наше творческое стремление.
В какой-то момент к DALL·E Mini обращались так часто, что компания Hugging Face — владелец серверов, на которых лежал проект — фиксировала по 50 тысяч генераций в сутки (команда не спала ночами, обслуживая нейросеть, пишет Wired). Популярность даже заставила разработчиков сменить название на Craiyon, чтобы алгоритм не ассоциировался с оригинальным проектом OpenAI.
Бесчисленные слои нейронов дрожат в танце с точками данных, учатся и адаптируются, складывая информацию в единое целое. И каждый раз, когда они проходят через этот процесс, появляется изображение. Фотография, сгенерированная из чисел и кода, настолько живая, что ее нельзя отличить от реальности.
Работает алгоритм не идеально — он ближе к уже устаревшей первой версии американской DALL·E. Однако это все еще самая сложная нейросеть в РФ. На ее тренировку ушло 24 тысяч GPU-дней — так называют произведение задействованных GPU (графических процессоров) и дней, которые ушли на обучение алгоритма (так, если вы используете 5 GPU и тренируете сеть 5 дней, потратите 25 GPU-дней).
Во-первых, его доступность. Бесплатность этого инструмента стирает границы, открывает двери в мир цифрового искусства и графического дизайна для каждого. Это не просто средство, это ключ к новому миру генерации картинок для людей со всего мира, независимо от их экономического положения.
GANs — это два танцующих партнера в ритме технологического вальса, один создает, другой критикует. «Генератор» создает новые образы, в то время как «дискриминатор» оценивает их, обучаясь на реальных примерах, чтобы различать истину от фикции. В результате генератор научается создавать все более убедительные изображения.
Недавно бета-версия DALL·E 2 стала доступна онлайн — чтобы протестировать ее, нужно встать в лист ожидания и дождаться очереди. Если же хочется понять прямо сейчас, на что способны современные нейросети, составили подборку программ на базе ИИ, которые создают картинки по текстовому описанию. Одни из них идеально подходят для портретов, другие — для сюрреалистичного искусства и иллюстраций. Можете испытать их сами или посмотреть на картинки, которые сгенерировали мы.
Во-вторых, генератор фото онлайн представляет собой идеальное сочетание сложности и простоты. Несмотря на то что технология, стоящая за ним, сложна и продвинута, сам генератор прост и интуитивен в использовании. Это приложение, где великий океан технологий сжимается до капли, которую может понять и использовать каждый.