Содержание статьи
Как я получила тысячи платящих пользователей за 13 дней
Ширли Мао: «Какая ты Барби?»
Сколько Мао и ее компании удалось заработать таким образом, неизвестно, но за несколько дней после запуска многочисленные «кукольные» фото заполонили интернет. Популярности сервиса способствовала и маркетинговая кампания фильма (создатели которого никак не связаны с проектом Мао), и внимание знаменитостей: свои фото в виде Барби выложили в соцсетях Тейлор Свифт, Селена Гомес, Кайли Дженнер и другие.
С развитием генеративного искусственного интеллекта эту технологию стали брать на вооружение многие создатели дизайнерского ПО, и в 2023-м свою версию представила Canva. Во-первых, благодаря ИИ становится проще обработка изображений (результаты фотомонтажа становятся более реалистичными). Во-вторых, появился встроенный генератор изображений по текстовому описанию.
Еще в школьные годы Ширли Мао открыла локальное отделение организации «Women In Tech» — глобального движения, которое поддерживает девушек в STEM. Затем поступила в Массачусетский технологический институт (MIT), где изучала биомеханику и биомедицинские устройства, робототехнику и приборостроение, а также компьютерные науки и искусственный интеллект. Будучи студенткой, Мао вошла в коллектив авторов нескольких статей, посвященных адресной доставке молекул прямиком в клетку (это повышает эффективность и снижает побочные эффекты от применения некоторых лекарств, в том числе использующихся в терапии ВИЧ), и прошла стажировку в Google и Facebook (теперь — Meta, признана в России экстремистской и запрещена).
В 2020 году Сбер выпустил рекламный ролик, главным героем которого стал персонаж фильма «Иван Васильевич меняет профессию» Жорж Милославский. Образ был создан на основе технологии deepfake компанией с похожим названием DeepCake. Ее соосновательница — выпускница Южно-Уральского университета, долгое время работавшая в рекламе Мария Чмир.
Конечно, топ открывает нашумевшая новинка — эта нейросеть создана независимыми разработчиками после выхода в свет фильма про Барби с Марго Робби в главной роли. Автор идеи — выпускница Массачусетского технологического института Ширли Мао, по совместительству она является соучредителем компании Rvnway, которая занимается разработкой биотехнологических стартапов. На сайте написано, что это «веселый пародийный проект».
Создательница bAIrbie не раскрывает статистику сервиса (на сайте даже счетчика посещаемости не стоит), мы предполагаем, что в ближайшие пару месяцев он может сравняться с официальным сервисом Mattel, учитывая, как быстро разлетаются картинки с замененными ИИ лицами Барби.
Но не стоит думать, что Ширли Мао на этом ничего не заработает — на работу сайта тоже требуются деньги, поэтому по умолчанию на все сгенерированные фото устанавливаются вотермарки. Снять их можно всего за $1.99 (180 рублей). Неплохие дополнительные инвестиции для Rvnway.
Сайт, который с помощью нейросети генерирует реалистичное изображение лица человека, которого в реальности не существует. Там нет кнопок, разделов и тому подобного — по умолчанию, когда пользователь открывает сервис, он видит только сгенерированное человеческое лицо. Используются две нейросети: генератор, который создает изображения, и дискриминатор, который определяет, насколько они реалистичны.
Кто создал bAIrbie.me
Шум вокруг фильма «Барби» породил множество коллабораций и продуктов, так или иначе связанных с картиной. Один из самых интересных и коммерчески успешных примеров — сайт bAIrbie.me, на котором каждый может загрузить фото и получить в ответ фотографию куклы Барби со своим лицом. Идея — простейшая, но она и сработала, потому что ресурс запустился вовремя.
Одновременно с выходом фильма «Барби» завирусилось веб-приложение Bairbie.me: его пользователи выкладывали в сеть свои фото в образе знаменитой куклы. Создательница приложения — выпускница Массачусетского технологического института Ширли Мао. Рассказываем о ней и о других создательницах проектов, где искусственный интеллект рисует популярные картинки
Canva — не первый графический редактор, в котором используется ИИ. Но у него ниже порог входа, он ориентирован не на профессиональных дизайнеров, а на всех, кому приходится так или иначе работать с изображениями — создавать презентации, подбирать картинки для публикаций в соцсетях, верстать несложные сайты. По состоянию на 2023 год у Canva более 6 млн командных подписчиков и около 125 млн пользователей совокупно.
Несмотря на относительную простоту, задумка Мао оказалась гениальной и гораздо более интересной, чем официальный сервис Mattel, который просто вставлял ваше лицо с фотографии в афишу фильма. Доисторический подход! Сервисом Mattel, по данным компании, воспользовались 13 млн человек с апреля.
Нейросеть, которая оживляет лица на фотографиях и улучшает качество снимков. Она превращает портреты людей в короткие видеоролики, герои которых улыбаются, вращают головой и моргают. Deep Nostalgia встроена в генеалогический онлайн-сервис MyHeritage, который помогает исследовать историю семьи, изучать исторические записи, находить родственников.
Чтобы превратиться в Барби или Кена, нужно загрузить свою фотографию, на которой хорошо видно лицо, а также выбрать несколько параметров по внешности: цвет волос (светлые, русые, темные или рыжие), цвет кожи (светлая, загорелая или темная) и одну из четырех рас. Результат генерации приходит на адрес электронной почты. Генерация занимает несколько минут, после чего можно либо скачать изображение с вотермаркой, либо заплатить 2 доллара за «чистую» картинку.
BaiRBIE.me
В 2021 году в развитии и распространении генеративного ИИ произошел скачок. Компания OpenAI представила нейросеть DALL-E, которая создавала изображения по текстовым запросам, и выложила в открытый доступ математическую модель CLIP — она в работе DALL-E занимается проверкой того, насколько получившееся изображение соответствует текстовому запросу. Сам генератор DALL-E опубликован не был, зато широкой аудитории оказался доступен другой, под названием VQGAN. Совместно с CLIP он стал общедоступным инструментом для генерации картинок. Его опубликовала его соавтор, программистка Кэтрин Кроусон.
«Я считаю, что стремление к красоте — это неотъемлемая потребность каждого человека», — говорила Чан. В 2015 году она основала Perfect Corp, которая разрабатывает приложения для «примерки» макияжа. Ее основные клиенты — бьюти-гиганты вроде Estée Lauder, Shiseido, Chanel и Revlon. Сомневающимся потребителям проще решиться на покупку, особенно в интернет-магазине, если они могут посмотреть, как тот или иной косметический продукт будет смотреться на лице.
Для того, чтобы озвучить картинку, нужно загрузить ее в соответствующее окошко на сайте. Нейросеть использует механизм распознавания объектов и базу данных из 52 000 звуковых файлов. Когда искуственный интеллект распознает объект, он добавляет к нему определенный звук. Пользователи могут опробовать нейросеть на живописи, доступной на сайте проекта.
Для того, чтобы сгенерировать новое лицо, нужно просто обновить страницу. Такой сервис полезен для дизайнеров, разработчиков и исследователей. Также это пример использования нейросетей для выполнения задач без необходимости нанимать моделей и фотографов. Этот проект демонстрирует возможности современных технологий машинного обучения и нейронных сетей в области компьютерного зрения.
Это проект на базе искуственного интеллекта, который разработала группа ученых из Японии в 2018 году. Он позволяет превращать изображения в соответствующий звуковой пейзаж, определенный нейронной сетью. Пользователи могут передвигаться по Google Street View и погружаться в воображаемые звуковые ландшафты — они созданы с помощью моделей глубокого обучения. Нейросеть умеет озвучивать случайное место на земле на Google Map, а также озвучивать другие изображения.
Для того, чтобы воспользоваться нейросетью, нужно загрузить файл с ней в соответствующее окно. Под каждым ообработанным фото будет две иконки: первая — разукрашенное изображение в оригинальном размере, вторая — сравнительная картинка, на которой одна половина снимка чёрно-белая, а другая — цветная. Бесплатно на аккаунт можно загрузить до 50 фото, причем на каждом будет отображаться текст «Создано с помощью Colorize.cc».
Если зайдете на сайт bAIrbie.me, то сразу увидите надпись, что это «веселый пародийный проект», а снизу — небольшую приписку «Этот сайт не был создан или одобрен компанией Barbie, Mattel или кем-либо, связанным с ними. Тем не менее, это классно». И это просчет Mattel — если бы компания сама запустила такой ресурс, то заработала бы еще немного денег на нем.
Чтобы начать использовать VQGAN+CLIP, нужно уметь хотя бы немного программировать, но все же этот инструмент гораздо доступнее широкой аудитории, чем математические модели той же OpenAI. После публикации VQGAN+CLIP соцсети и форумы наводнили сгенерированные с его помощью изображения. А затем начали появляться программные оболочки для тех, кто программировать не умеет. Например, веб-приложение NightCafe, созданное изначально для переноса стиля (это когда вы даете нейросети запрос вроде «нарисуй героев сериала «Симпсоны» в стиле Ван Гога»), подключило VQGAN+CLIP, чтобы начать генерировать изображения по более сложным запросам.