Содержание статьи
Нейросеть создаёт фото несуществующих котов и фейлит. Многолапым и кривым чудищам со снимков место в ужастиках
Откуда появились видео и как их делают
Но если человеческие портреты у алгоритма выходят настолько похожими на снимки реальных людей, что это даже пугает, то с изображениями животных всё не так просто. Об этом создатели StyleGAN сообщали ещё в декабре, в качестве доказательства опубликовав коллаж с пушистиками, многие из которых были кривыми и несуразными.
Главные герои историй — рыжие полосатые коты. Изначально их было двое: крупный взрослый кот по имени Чабби и его сын, котенок Чабби-младший . Они сталкивались с трудностями, а иногда и с настоящими трагедиями. Например, в одном из роликов бездомного Чабби сажают в тюрьму за кражу колбасы. А в другом Чабби-младший погибает в аварии.
В случае же с портретами людей всё было куда проще, так как StyleGAN нужно было создавать лишь лица, сфотографированные в анфас. Если бы разработке пришлось генерировать человеческие тела в разных позах, результаты были бы такими же, как с кошками, говорит Шейн.
А в середине февраля, после того как NVIDIA опубликовала в свободном доступе алгоритм, разработчик Филипп Ван из США сделал на его основе два сайта, пишет Inverse. Первый — This Person Does Not Exist — успешно генерирует новые лица людей. Другой портал, This Cat Does Not Exist, создаёт фотографии несуществующих кошек.
С полной версией развлечься могут только те, кого компания отберет для тест-драйва. Зато есть доступная мини-версия DALL-E — Craiyon. Она, конечно, не так круто натренирована, а изображения доступны только в небольшом разрешении, но интересные результаты получить вполне можно. А еще Craiyon — open source проект, разработчики могут найти код на Github и потренировать нейросеть самостоятельно.
Другие аккаунты начали делать видео с котами разных цветов и с женскими персонажами. Здесь истории обычно посвящены семейной жизни: неожиданная беременность, тяжелые роды, измены. В одном ролике кошка начинает рожать в супермаркете, и ее на скорой отвозят в больницу. Муж-кот, приехав, обнаруживает, что вместо котенка родился щенок. И едет на разборки с биологическим отцом ребенка.
Dream Studio от Stable Diffusion
Максимальный размер картинок — 1024×1024 px. Сервис не полностью бесплатный, там сложная система кредитов (credits). На старте каждому пользователю дают 200 кредитов. У каждой картинки своя стоимость — в зависимости от размера и числа шагов для ее генерации — от 0,2 до нескольких кредитов. Когда лимит будет исчерпан, кредиты можно докупить — подробные условия можно найти в разделе FAQ на сайте.
Котов ИИ рисует весьма правдоподобно, а с компьютерами что-то не ладится: Midjourney будто собирает очертания ноутбука из фрагментов других предметов. Но выглядит все равно занимательно. А с более традиционными сюжетами нейронка справляется еще лучше: в чате в Discord вы будете видеть все, что генерируют другие пользователи.
Нейросеть можно подталкивать в нужном направлении, чтобы доводить картинки до ума. Получив первый запрос, Midjounrney выдаст вам 4 изображения. Потом можно выбрать одно из них и доработать детали (командами U1, U2, U3 и U4) либо сделать еще 4 варианта на его основе (командами V1, V2, V3, V4).
Авторы роликов слишком прямо давят на эмоции. По качеству видео бывают разные, но их все объединяет манипулятивный сторителлинг. Коты постоянно оказываются в беде и сталкиваются с несправедливостью. Они умирают, голодают, теряют близких — часто из-за безразличия окружающих или даже их активного участия. Авторы намеренно выбирают самые жесткие темы, чтобы вызвать сильные эмоции у зрителя.
Готовы применять искусственный интеллект с пользой? Мы проверили в работе 5 бесплатных сервисов для генерации картинок — попросили их нарисовать портрет кота-айтишника для Bubble, и теперь делимся результатами. Посмотрите, вдруг нейронки могут быть полезны и вам.
А пользователи соцсетей с постсоветского пространства в феврале увлеклись сервисом SearchFace. Портал с лёгкостью находил страницу ВК по одному фото человека — учитывая то, что снимку не обязательно было быть опубликованным в соцсетях. Правда, испугавшись иска со стороны соцсети, создатели сервиса изменили принцип работы: теперь он не выдаёт ссылки на аккаунты «ВКонтакте». Но снимки себя и двойников в нём по-прежнему можно увидеть.
В декабре компания NVIDIA представила алгоритм StyleGAN, способный с помощью нейросетей создавать новые фотографии. Разработка позволяет получить снимки машин, интерьеров и человеческих лиц, не существующих в реальности. Такого результата искусственному интеллекту удаётся достичь благодаря генеративно-состязательным нейросетям: одна из них, изучая большую фотобазу, создаёт изображение, а другая его анализирует и сравнивает с оригинальными снимками.
Изначально бета-версия Stable Diffusion была доступна в Discord, как и Midjourney. Но сейчас доступ закрыли и запустили полноценный пользовательский сервис на отдельном сайте. Интерфейс простой и удобный, есть много возможностей для кастомизации изображений: можно увеличить ширину или высоту, количество изображений под один запрос и число шагов, которое нейросеть совершит для генерации.
Как нейрокоты доводят детей до слез
В июне 2024 года пользователи начали публиковать в «Тиктоке» ролики с детьми, которые смотрят истории котов и плачут. Некоторых доводит до слез только кошачий кавер на What Was I Made For? Оно и понятно: простые истории о несправедливости с грустной музыкой легко находят отклик у младшего поколения.
У самого популярного видео 161 миллион просмотров, его репостнула певица Билли Айлиш. Так плачущие дети запустили вторую волну тренда и сделала его еще более депрессивным. А в комментариях пользователи задаются вопросом, этично ли показывать такой контент детям и намеренно расстраивать их ради просмотров в соцсетях.
Dream Studio — пользовательский сервис на основе нейросети Stable Diffusion. Это еще один конкурент Midjourney и DALL-E 2. Над Stable Diffusion работают исследователи из Великобритании и Калифорнии, тренировка первой версии нейросети стоила 600 000 долларов. Вот так Stable Diffusion, например, переделывает картины классиков:
Midjourney состоит как бы из двух сообщающихся нейросетей — одна расшифровывает текст, а другая создает по ключевым словам картинку. Ничего прорывного в этом нет, подобные технологии были раньше. Но Midjourney покорила публику своей доступностью — каждый может сгенерировать изображение приличного качества через чат в Discord.
Это творчество далеко от живописи старых мастеров, зато креатива хоть отбавляй. А еще сервис полностью бесплатный — можно вдоволь экспериментировать. Главный минус — картинки получаются маленькими, 256×256 px. Но для иллюстрации к посту в Twitter вполне сгодится.
У нейросети не всегда удаются реалистичные фото кошек, так как снимки пушистых сильно отличаются между собой, рассказала порталу Bleeping Computer исследовательница Джанель Шейн. Алгоритму приходится учитывать разные позы животных, фон, на котором частенько присутствует мебель, людей и так далее.