Содержание статьи
Suno AI: как пользоваться нейросетью для генерации песен
Искусственный интеллект не всегда эффективен для создания трейлеров
Финал получился вот таким. Несмотря на то что текста в запросе не было, местами вылезают фрагменты припева из исходного трека. Если хочется этого избежать, можно перегенерировать трек — результат при каждой попытке немного различается. Либо вместо текста прописать какое-то звукоподражание. Тогда нейропевцы будут исполнять его, а артефакты из предыдущих куплетов — нет.
Нейросеть может облегчить жизнь во всех сферах, в том числе и в монтаже трейлеров. Я сейчас, например, пользуюсь нейросетью VocalRemover, которая качественно отделяет реплики от музыки. Она сильно упрощает пайплайны и экономит время. Также есть нейросети, которые улучшают качество видео, мастеринг могут делать. ИИ вполне может помочь в поиске музыки, потому что это долгий начальный этап в монтаже трейлера. Нейросеть нарежет какие-то крутые кадры, а монтажёр уже будет выбирать.
Монтаж по тексту может облегчить жизнь на одном из этапов. Но люди сами должны решать, годится кадр или нет. Например, будет написано: «Человек с пистолетом стреляет» — а снято и сыграно всё может быть совершенно по-разному. Нейросеть просто не в состоянии самостоятельно выбрать необходимые кадры.
Длина трека зависит от текста, но обычно не превышает двух минут. Но любую генерацию можно продолжить, каждый следующий сегмент — минута. Для этого надо нажать на три точки возле трека в списке ваших генераций и выбрать Extend. Учтите, что на это тоже расходуются кредиты.
Шаг 2. В поле Song Description напишите, что хотите получить. Создатели сервиса рекомендуют не вдаваться в детали, расписывая инструменты и поджанры, а описать историю или настроение. Например, «детская песня о посещении зоопарка на день рождения Алисы» или «лаундж-композиция от лица пианиста, работающего в баре, который хочет пойти домой, потому что уже поздний вечер и пора закрываться».
Указывать конкретного исполнителя в запросе не стоит. Создатели сервиса говорят, что нейросеть не определяет, это реально существующий человек или вымышленный. На практике сервис выдает ошибку, увидев имя в запросе, но иногда все же генерирует трек. Голос не клонируется в точности. Но в целом песня похожа на то, что исполнял выбранный человек. Например, если вы попросили балладу, спетую голосом, похожим на голос Фрэнка Синатры, за несколько попыток можно получить что-то похожее. Но это затратно по кредитам.
А еще в текст песни можно вставить метатеги — то есть в квадратных скобках указать, где начинается припев и когда заканчивается трек. Это необязательно, но помогает добиться более точного результата. Например, я попыталась создать лиричную рок-балладу «Чипи-чипи чапа-чапа», и она закончилась очень резко. Чтобы этого избежать, пришлось разобраться, в чем проблема. Оказалось, лучше поставить тег для завершения композиции.
Перечислите желаемые признаки через запятую или опишите одной фразой подлиннее. Это даст разные результаты. Для нейросети запятая или другие знаки препинания и пробел после — как бы разделитель равноправных запросов. А длинная фраза, пусть и с теми же словами, — это описание какой-то одной заявки.
Сравнение платных подписок в Suno AI
ИИ активно используются в киноиндустрии — нейросети способны быстро объединить видеофрагменты, определить лучшие кадры, удалить дубликаты или неудачные дубли . Конечно, такое активное использование искусственного интеллекта вызывает множество опасений: а вдруг нейросети вытеснят людей? Профессионалы, с которыми мы поговорили, настроены очень по-разному.
Новые сервисы, вроде Vidyo освобождают руки и берут на себя монтаж «одним кликом». Сервисы Synthetik, Rokoko и WarpFusion эффективно работают с моушн-дизайном и анимацией. Люди, далёкие от киноиндустрии, могут теперь создавать достаточно крутые видеоролики вместе с озвучкой, музыкой и монтажом.
Сервис качественно генерирует песни по текстовому запросу. При фоновом прослушивании их сложно отличить от созданных людьми. Suno AI пишет музыку и слова, в том числе на русском языке. А еще может нарисовать обложку. Первые десять треков — бесплатные. На главной странице сервиса можно посмотреть работы других пользователей.
Возможности нейросетей практически безграничны: ИИ хорошо справляется с автоматическим монтажом. При помощи ИИ можно «дорисовывать» детали, менять фон, применять спецэффекты и фильтры, генерировать плавные переходы между кадрами, создавать анимацию для персонажей или объектов.
Основная причина, почему стоит задуматься о покупке подписки, — авторские права. Если вы хотите монетизировать песни на «Ютубе», загружать на стриминговые платформы или лицензировать для использования в рекламе, кино, на телевидении или в подкастах, бесплатной версии будет недостаточно. Потребуется любой вариант платной подписки — Pro или Premier.
Но качество работы ИИ тоже растёт. Когда в будущем мы сможем генерировать видео, неотличимое от текущего качества съёмки, то сразу же люди будут стараться снимать круче и интереснее, чем нейросеть. Потолка в том, насколько хорошо выглядит картинка в кино, — нет.