Содержание статьи
Нейросети для генерации видео: 4 бесплатных сервиса
Cutout
Если выбрать нейтральный по эмоциям образец, сервис оставит размер исходника прежним. А если предпочесть более динамичный вариант, обрежет фон. Наверное, чтобы его не размывать. За HD-качество нужно платить кредитами, а бесплатное превью никуда не годится. Но сама анимация не такая уж плохая.
Сгенерированный контент проходит автоматическую модерацию. В правилах отмечается, что проверка идет на наготу, неприемлемый и защищенный авторским правом контент. Не уточняется, что именно подпадает под неприемлемый контент, но нейросеть иногда норовит создавать его по самым простым и невинным запросам.
За 11 кредитов вы получаете от двух до четырех вариантов изображений. Из них можно выбрать любое и анимировать уже без дополнительной траты кредитов. Если картинки не понравились, можно потратить еще 11 кредитов на создание новой партии. Это удобно: пользователю не только дают выбор, но и позволяют сразу внести изменения, не дожидаясь создания анимации.
На фото с кошкой алгоритмы анимировали шерсть и заставили питомца насупиться. Немного нахмурился и Илон Маск. А вот заставить сидящую в кресле кошку встать у меня не получилось. Вместо этого алгоритмы добавили к ней крохотную полумышку-полукошку, которая садится на подлокотник.
Анимировать фото можно только целиком с помощью готовых параллакс-эффектов. То есть заставить двигаться отдельные части картинки нельзя. Зато можно добавить на изображение готовое анимированное небо — чистое, предштормовое или закатное. Выглядит правдоподобно, если на исходнике достаточно места для облаков.
Модель создали разработчики нейросети для генерации картинок Stable Diffusion — основного конкурента Midjourney и Dall-E 3 . Главной фишкой называют понимание объема: алгоритм умеет додумывать, как выглядят предметы с других ракурсов. Stable Diffusion Video представили в конце ноября 2023 года. Доступно несколько версий.
Качество генерации: ❤️❤️❤️
Удобство использования: 🤩🤩🤩🤩
Есть ли русский язык: есть автоперевод
Лимиты: на 3-секундные анимации в разрешении 340p ограничений нет
Сколько стоит: от 19 $ ( 1900 ₽) за минуту анимации в 720р и возможность убрать вотермарку
Где доступен: на сайте
Например, заставить облака плыть по небу, а человека улыбаться. Причем хорошая технология сама поймет, как анимировать объект: отличит ребенка от дерева, учтет, что глаза должны моргать, а не разбегаться в разные стороны. Получаются красивые гифки, которые смотрятся интереснее стандартных фото и картинок.
Pika
Качество генерации: ❤️❤️❤️❤️
Удобство использования: 🤩🤩
Есть ли русский язык: да
Лимиты: нет ограничений
Сколько стоит: от 299 ₽ в месяц за более высокое качество, дополнительные эффекты и возможность убрать вотермарку
Где доступен: iOS, Andorid
Качество генерации: ❤️❤️❤️❤️❤️
Удобство использования: 🤩🤩🤩🤩🤩
Есть ли русский язык: нет
Лимиты: около 25 трехсекундных анимаций после регистрации, потом — по 3 в сутки
Сколько стоит: от 10 $ ( 1000 ₽) в месяц за дополнительные функции, кредиты и возможность убрать вотермарку
Где доступен: на сайте
Да, пока еще не так хорошо, как текст или картинки. У нейросетей для генерации видео есть серьезные ограничения: они не могут создать ролик длиннее нескольких секунд, а уровень реализма пока далек от какого-нибудь Midjourney. Сгенерировать одну хорошую картинку — уже непросто. А в видео надо не только создавать множество кадров, но и сделать так, чтобы они соотносились друг с другом.
Вторая модель Runway — самая продвинутая среди доступных широкой публике нейросетей для видео. Она хорошо рисует переходы между кадрами, особенно при анимации картинок и фотографий. Изображение «штормит» заметно меньше, чем у других сервисов. А еще у нее есть режим, с которым можно генерировать серию видеороликов с похожим визуальным стилем.
Качество генерации: ❤️❤️❤️
Удобство использования: 🤩🤩🤩🤩🤩
Есть ли русский язык: да
Лимиты: без ограничений в разрешении 1080р
Сколько стоит: от 749 ₽ в месяц за более высокое качество и дополнительные функции
Где доступен: iOS, Andorid
Из любопытного — функция липсинка. Заставить голову заговорить можно как при первой загрузке изображения, так и после работы с ним. Сервис советует использовать фотографии, где лицо расположено анфас. В библиотеке больше 30 синтезированных голосов. Достаточно выбрать понравившийся и прописать свой текст, в том числе на русском языке. Если артикуляция покажется странной, можно перегенерировать.
Runway умеет генерировать видео. И позволяет загрузить свое изображение и анимировать его. В настройках можно отрегулировать амплитуду и наклон, направление, зум, ротацию камеры. А еще — выставить сиды и включить интерполяцию. С ней переходы между кадрами получаются более плавными. Но как это будет выглядеть в итоге, покажут только после генерации.
Cервис анимирует исключительно лицо, поэтому только его и оставляет на выходе, отрезая все остальное. Морду кошки как лицо он не распознал. А вот огромную каменную голову-статую принял. Правда, результат вышел плохой. Вероятно, потому, что нейросеть не смогла разметить, где какие черты.