Содержание статьи
Suno AI: как пользоваться нейросетью для генерации песен
Riffusion
Запросом может быть не только текст, но и изображение. Нейросеть проанализирует картинку и создаст подходящий по смыслу трек. В теории можно узнать, как звучат кадры из фильмов или произведения искусства. Однако по снимку йогурта нейросеть создала странную и роботизированную мелодию, которая вряд ли хоть как-то ассоциируется с рекламой.
Качество генерации: 🎵🎵🎵🎵🎵
Что умеет: генерировать песни с вокалом по текстовому запросу, редактировать треки
Лимиты: 50 кредитов хватает на пять попыток
Платные функции: больше кредитов от 10 $ ( 878 ₽) в месяц, но российской картой оплатить нельзя
В Udio много возможностей повлиять на результат: как задавать изначальный промпт, так и редактировать получившуюся песню. Однако качество генерации на русском иногда хромает. Некоторые слова сливаются, получается каша. Но если разобраться в настройках, то можно добиться хорошего результата.
Сервис сразу предлагает выбрать стиль композиции: электронная музыка, рэп, лоу-фай, грув или медитативная. В этих режимах повлиять на результат генерации невозможно: нейросеть создает случайный трек, подходящий под тематику. Но после генерации можно изменить инструменты и эффекты.
А еще в текст песни можно вставить метатеги — то есть в квадратных скобках указать, где начинается припев и когда заканчивается трек. Это необязательно, но помогает добиться более точного результата. Например, я попыталась создать лиричную рок-балладу «Чипи-чипи чапа-чапа», и она закончилась очень резко. Чтобы этого избежать, пришлось разобраться, в чем проблема. Оказалось, лучше поставить тег для завершения композиции.
Качество генерации: 🎵🎵🎵
Что умеет: генерировать инструментальную музыку по текстовому запросу или картинке
Лимиты: не более 30 минут в день, до 25 треков в месяц
Платные функции: больше генераций и возможность скачивать треки без потери качества от 14 $ ( 1230 ₽) в месяц, но российской картой оплатить нельзя
Шаг 2. В поле Song Description напишите, что хотите получить. Создатели сервиса рекомендуют не вдаваться в детали, расписывая инструменты и поджанры, а описать историю или настроение. Например, «детская песня о посещении зоопарка на день рождения Алисы» или «лаундж-композиция от лица пианиста, работающего в баре, который хочет пойти домой, потому что уже поздний вечер и пора закрываться».
Доступна также генерация по текстовому запросу. В этом режиме остальные параметры указывать нельзя. По промпту «a song about yogurt for advertising, dynamic, funny, rhythmic» нейросеть сгенерировала три композиции. Однако ни одна из них не имела почти ничего общего с запросом. Все треки были ритмичными, но не веселыми, которые можно было бы услышать в реальной рекламе.
Сравнение платных подписок в Suno AI
На главном экране предлагают выбрать параметры для будущего трека: длительность, темп, жанр, настроение и тематику — мелодия для свадебного видео, документального кино, рекламы, трейлера или влога. Можно отметить галочками инструменты, которые вы хотите использовать: гитару, бас, барабаны, фортепиано. Текстовый запрос написать нельзя.
Suno может не только придумать текст, но и исполнить ваш. Функция идеально подойдет для озвучивания переписок или мемных текстов. Для этого нужно перейти в раздел Create, нажать переключатель Custom, в поле Lyrics написать текст, в а в поле Style of Music указать на жанр трека.
Указывать конкретного исполнителя в запросе не стоит. Создатели сервиса говорят, что нейросеть не определяет, это реально существующий человек или вымышленный. На практике сервис выдает ошибку, увидев имя в запросе, но иногда все же генерирует трек. Голос не клонируется в точности. Но в целом песня похожа на то, что исполнял выбранный человек. Например, если вы попросили балладу, спетую голосом, похожим на голос Фрэнка Синатры, за несколько попыток можно получить что-то похожее. Но это затратно по кредитам.
Вкладка Camera позволяет генерировать текст по картинке. Снимок можно сделать прямо из приложения. Нейросеть споет буквально о том, что изображено. Например, если сфотографировать натюрморт с фруктами и йогуртом, то нейропевец перечислит их и опишет вкус — и все это в рифму.
Финал получился вот таким. Несмотря на то что текста в запросе не было, местами вылезают фрагменты припева из исходного трека. Если хочется этого избежать, можно перегенерировать трек — результат при каждой попытке немного различается. Либо вместо текста прописать какое-то звукоподражание. Тогда нейропевцы будут исполнять его, а артефакты из предыдущих куплетов — нет.
Media.io — сервис со множеством ИИ-функций, от улучшения качества фото до изменения голоса. Одна из них — генератор инструментальной музыки. Создавать песни можно по жанру — хип-хоп, рок, акустика, — настроению — счастливое, грустное, романтичное — или теме — реклама, трейлер, влог, занятия спортом. Либо написать текстовый запрос на английском языке.
Качество генерации: 🎵🎵
Что умеет: генерировать инструментальную музыку по заданным параметрам
Лимиты: 25 песен бесплатно, но их нельзя скачать
Платные функции: от 9,99 $ ( 878 ₽) в месяц за бесконечное количество треков и возможность скачивать мелодии, но российской картой оплатить нельзя
Голос оказался не очень похожим на Айлиш. Вероятно, основное сходство потерялось из-за того, что песня на русском языке, а мелодия слишком ритмичная. Чтобы получить более качественный вариант, можно воспользоваться аналогичной нейросетью so-vits-svc , но придется разбираться с сервисом Google Collab.