Нейросеть которая рисует котов

0
22

Нейросеть создаёт фото несуществующих котов и фейлит. Многолапым и кривым чудищам со снимков место в ужастиках

Dream Studio от Stable Diffusion

Dream Studio — пользовательский сервис на основе нейросети Stable Diffusion. Это еще один конкурент Midjourney и DALL-E 2. Над Stable Diffusion работают исследователи из Великобритании и Калифорнии, тренировка первой версии нейросети стоила 600 000 долларов. Вот так Stable Diffusion, например, переделывает картины классиков:

Midjourney состоит как бы из двух сообщающихся нейросетей — одна расшифровывает текст, а другая создает по ключевым словам картинку. Ничего прорывного в этом нет, подобные технологии были раньше. Но Midjourney покорила публику своей доступностью — каждый может сгенерировать изображение приличного качества через чат в Discord.

А пока ждете, можете поработать с нейронками, которые уже есть в открытом доступе — это чуть более старые разработки или бета-версии новых ИИ. Они выдают вполне годные результаты. Если вы еще платите дизайнеру за обложки своих Youtube-роликов или баннеры на личном сайте, можно «нанять» нейросеть и сэкономить. Представляем вашему вниманию несколько кандидатов: мы уже выдали им тестовые задания.

Авторы роликов слишком прямо давят на эмоции. По качеству видео бывают разные, но их все объединяет манипулятивный сторителлинг. Коты постоянно оказываются в беде и сталкиваются с несправедливостью. Они умирают, голодают, теряют близких — часто из-за безразличия окружающих или даже их активного участия. Авторы намеренно выбирают самые жесткие темы, чтобы вызвать сильные эмоции у зрителя.

У самого популярного видео 161 миллион просмотров, его репостнула певица Билли Айлиш. Так плачущие дети запустили вторую волну тренда и сделала его еще более депрессивным. А в комментариях пользователи задаются вопросом, этично ли показывать такой контент детям и намеренно расстраивать их ради просмотров в соцсетях.

Другие аккаунты начали делать видео с котами разных цветов и с женскими персонажами. Здесь истории обычно посвящены семейной жизни: неожиданная беременность, тяжелые роды, измены. В одном ролике кошка начинает рожать в супермаркете, и ее на скорой отвозят в больницу. Муж-кот, приехав, обнаруживает, что вместо котенка родился щенок. И едет на разборки с биологическим отцом ребенка.

Разработчик из США создал сайт, где благодаря нейросети можно получить фото кошки, не существующей в реальности. Мужчина использовал алгоритм NVIDIA, который хорошо зарекомендовал себя при генерации человеческих лиц. Но с кошачьими у искусственного интеллекта дела идут не так гладко: вместо реалистичных питомцев портал частенько выдаёт фото жутковатых и мемных созданий.

Готовы применять искусственный интеллект с пользой? Мы проверили в работе 5 бесплатных сервисов для генерации картинок — попросили их нарисовать портрет кота-айтишника для Bubble, и теперь делимся результатами. Посмотрите, вдруг нейронки могут быть полезны и вам.

Как нейрокоты доводят детей до слез

Изначально бета-версия Stable Diffusion была доступна в Discord, как и Midjourney. Но сейчас доступ закрыли и запустили полноценный пользовательский сервис на отдельном сайте. Интерфейс простой и удобный, есть много возможностей для кастомизации изображений: можно увеличить ширину или высоту, количество изображений под один запрос и число шагов, которое нейросеть совершит для генерации.

Котов ИИ рисует весьма правдоподобно, а с компьютерами что-то не ладится: Midjourney будто собирает очертания ноутбука из фрагментов других предметов. Но выглядит все равно занимательно. А с более традиционными сюжетами нейронка справляется еще лучше: в чате в Discord вы будете видеть все, что генерируют другие пользователи.

В июне 2024 года пользователи начали публиковать в «Тиктоке» ролики с детьми, которые смотрят истории котов и плачут. Некоторых доводит до слез только кошачий кавер на What Was I Made For? Оно и понятно: простые истории о несправедливости с грустной музыкой легко находят отклик у младшего поколения.

ЧИТАТЬ ТАКЖЕ:  Как используют искусственный интеллект в китае

А пользователи соцсетей с постсоветского пространства в феврале увлеклись сервисом SearchFace. Портал с лёгкостью находил страницу ВК по одному фото человека — учитывая то, что снимку не обязательно было быть опубликованным в соцсетях. Правда, испугавшись иска со стороны соцсети, создатели сервиса изменили принцип работы: теперь он не выдаёт ссылки на аккаунты «ВКонтакте». Но снимки себя и двойников в нём по-прежнему можно увидеть.

Главные герои историй — рыжие полосатые коты. Изначально их было двое: крупный взрослый кот по имени Чабби и его сын, котенок Чабби-младший . Они сталкивались с трудностями, а иногда и с настоящими трагедиями. Например, в одном из роликов бездомного Чабби сажают в тюрьму за кражу колбасы. А в другом Чабби-младший погибает в аварии.

В случае же с портретами людей всё было куда проще, так как StyleGAN нужно было создавать лишь лица, сфотографированные в анфас. Если бы разработке пришлось генерировать человеческие тела в разных позах, результаты были бы такими же, как с кошками, говорит Шейн.

В декабре компания NVIDIA представила алгоритм StyleGAN, способный с помощью нейросетей создавать новые фотографии. Разработка позволяет получить снимки машин, интерьеров и человеческих лиц, не существующих в реальности. Такого результата искусственному интеллекту удаётся достичь благодаря генеративно-состязательным нейросетям: одна из них, изучая большую фотобазу, создаёт изображение, а другая его анализирует и сравнивает с оригинальными снимками.

С полной версией развлечься могут только те, кого компания отберет для тест-драйва. Зато есть доступная мини-версия DALL-E — Craiyon. Она, конечно, не так круто натренирована, а изображения доступны только в небольшом разрешении, но интересные результаты получить вполне можно. А еще Craiyon — open source проект, разработчики могут найти код на Github и потренировать нейросеть самостоятельно.

Какие истории рассказывают в мемах

У нейросети не всегда удаются реалистичные фото кошек, так как снимки пушистых сильно отличаются между собой, рассказала порталу Bleeping Computer исследовательница Джанель Шейн. Алгоритму приходится учитывать разные позы животных, фон, на котором частенько присутствует мебель, людей и так далее.

Нейросеть можно подталкивать в нужном направлении, чтобы доводить картинки до ума. Получив первый запрос, Midjounrney выдаст вам 4 изображения. Потом можно выбрать одно из них и доработать детали (командами U1, U2, U3 и U4) либо сделать еще 4 варианта на его основе (командами V1, V2, V3, V4).

Это творчество далеко от живописи старых мастеров, зато креатива хоть отбавляй. А еще сервис полностью бесплатный — можно вдоволь экспериментировать. Главный минус — картинки получаются маленькими, 256×256 px. Но для иллюстрации к посту в Twitter вполне сгодится.

А в середине февраля, после того как NVIDIA опубликовала в свободном доступе алгоритм, разработчик Филипп Ван из США сделал на его основе два сайта, пишет Inverse. Первый — This Person Does Not Exist — успешно генерирует новые лица людей. Другой портал, This Cat Does Not Exist, создаёт фотографии несуществующих кошек.

Максимальный размер картинок — 1024×1024 px. Сервис не полностью бесплатный, там сложная система кредитов (credits). На старте каждому пользователю дают 200 кредитов. У каждой картинки своя стоимость — в зависимости от размера и числа шагов для ее генерации — от 0,2 до нескольких кредитов. Когда лимит будет исчерпан, кредиты можно докупить — подробные условия можно найти в разделе FAQ на сайте.

Но если человеческие портреты у алгоритма выходят настолько похожими на снимки реальных людей, что это даже пугает, то с изображениями животных всё не так просто. Об этом создатели StyleGAN сообщали ещё в декабре, в качестве доказательства опубликовав коллаж с пушистиками, многие из которых были кривыми и несуразными.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь