Как сделать мешап через нейросеть

0
17

Suno AI: как пользоваться нейросетью для генерации песен

Riffusion

Media.io — сервис со множеством ИИ-функций, от улучшения качества фото до изменения голоса. Одна из них — генератор инструментальной музыки. Создавать песни можно по жанру — хип-хоп, рок, акустика, — настроению — счастливое, грустное, романтичное — или теме — реклама, трейлер, влог, занятия спортом. Либо написать текстовый запрос на английском языке.

Качество генерации: 🎵🎵🎵🎵
Что умеет: перепевать песни голосами известных исполнителей или героев поп-культуры
Лимиты: три бесплатные генерации в час
Платные функции: больше генераций и голосов исполнителей от 9,99 $⁣ ( 878 ₽) в месяц, но российской картой оплатить нельзя

Оба моих сгенерированных варианта звучали удачно, только на русском языке были проблемы с рифмой. Мне понравился трек «Йогуртовая мечта» — название тоже придумала нейросеть. Мотив запоминающийся, песня надолго засела у меня в голове. А больше для хорошего джингла ничего и не нужно.

Длина трека зависит от текста, но обычно не превышает двух минут. Но любую генерацию можно продолжить, каждый следующий сегмент — минута. Для этого надо нажать на три точки возле трека в списке ваших генераций и выбрать Extend. Учтите, что на это тоже расходуются кредиты.

Лимиты жесткие: только два трека по текстовому запросу и два трека по жанру длительностью до 5 минут. Для своей задачи я выбрала жанр Acoustic, настроение Happy, тему Ads & Trailers. Продолжительность — 1 минута. Получилась приятная мелодия, которую можно использовать для рекламы или влога на «Ютубе».

Сервис сразу предлагает выбрать стиль композиции: электронная музыка, рэп, лоу-фай, грув или медитативная. В этих режимах повлиять на результат генерации невозможно: нейросеть создает случайный трек, подходящий под тематику. Но после генерации можно изменить инструменты и эффекты.

Режим Compose позволяет отдельно написать текст песни на вкладке Lyrics и отдельно запрос для генерации мелодии на вкладке Sound. Если нажать на кнопку Write for me, то сгенерируется случайный текст песни. При вводе промпта для мелодии можно нажимать на случайные теги вместо того, чтобы прописать самому.

Качество генерации: 🎵🎵
Что умеет: генерировать инструментальную музыку по заданным параметрам
Лимиты: нет, но бесплатно треки скачать нельзя
Платные функции: 16,99 $⁣ ( 1493 ₽) за возможность скачивать треки и дополнительные функции, но российской картой оплатить нельзя

Media.io

Доступна также генерация по текстовому запросу. В этом режиме остальные параметры указывать нельзя. По промпту «a song about yogurt for advertising, dynamic, funny, rhythmic» нейросеть сгенерировала три композиции. Однако ни одна из них не имела почти ничего общего с запросом. Все треки были ритмичными, но не веселыми, которые можно было бы услышать в реальной рекламе.

Вкладка Camera позволяет генерировать текст по картинке. Снимок можно сделать прямо из приложения. Нейросеть споет буквально о том, что изображено. Например, если сфотографировать натюрморт с фруктами и йогуртом, то нейропевец перечислит их и опишет вкус — и все это в рифму.

3. **Работа с текстом и аудио**: Для генерации диалогов и песен вам понадобится работа с нейросетями, специализирующимися на обработке естественного языка (NLP) и аудиоданных. Рекуррентные нейросети (RNN) и Генеративно-состязательные нейросети (GAN) являются двумя примерами, которые часто используются для этих целей【9†источник】.

На главном экране предлагают выбрать параметры для будущего трека: длительность, темп, жанр, настроение и тематику — мелодия для свадебного видео, документального кино, рекламы, трейлера или влога. Можно отметить галочками инструменты, которые вы хотите использовать: гитару, бас, барабаны, фортепиано. Текстовый запрос написать нельзя.

ЧИТАТЬ ТАКЖЕ:  Искусственный интеллект сказал что уничтожит человечество

Mubert генерирует только инструментальную музыку на основе собственной библиотеки семплов. Чтобы создать песню, достаточно написать текстовый запрос на английском языке или выбрать настроение, жанр и стиль. А после этого указать длительность и тип песни — трек, джингл, луп или микс.

Создание нейросети, способной генерировать диалоги и песни в стиле «Губки Боба», является сложным проектом, требующим понимания основ работы и обучения нейронных сетей, а также умения работать с соответствующими инструментами и библиотеками. Вот основные шаги и концепции, которые вам понадобятся для начала работы:

Suno может не только придумать текст, но и исполнить ваш. Функция идеально подойдет для озвучивания переписок или мемных текстов. Для этого нужно перейти в раздел Create, нажать переключатель Custom, в поле Lyrics написать текст, в а в поле Style of Music указать на жанр трека.

Финал получился вот таким. Несмотря на то что текста в запросе не было, местами вылезают фрагменты припева из исходного трека. Если хочется этого избежать, можно перегенерировать трек — результат при каждой попытке немного различается. Либо вместо текста прописать какое-то звукоподражание. Тогда нейропевцы будут исполнять его, а артефакты из предыдущих куплетов — нет.

Как отредактировать сгенерированный трек в Suno AI

Перечислите желаемые признаки через запятую или опишите одной фразой подлиннее. Это даст разные результаты. Для нейросети запятая или другие знаки препинания и пробел после — как бы разделитель равноправных запросов. А длинная фраза, пусть и с теми же словами, — это описание какой-то одной заявки.

Основная причина, почему стоит задуматься о покупке подписки, — авторские права. Если вы хотите монетизировать песни на «Ютубе», загружать на стриминговые платформы или лицензировать для использования в рекламе, кино, на телевидении или в подкастах, бесплатной версии будет недостаточно. Потребуется любой вариант платной подписки — Pro или Premier.

Указывать конкретного исполнителя в запросе не стоит. Создатели сервиса говорят, что нейросеть не определяет, это реально существующий человек или вымышленный. На практике сервис выдает ошибку, увидев имя в запросе, но иногда все же генерирует трек. Голос не клонируется в точности. Но в целом песня похожа на то, что исполнял выбранный человек. Например, если вы попросили балладу, спетую голосом, похожим на голос Фрэнка Синатры, за несколько попыток можно получить что-то похожее. Но это затратно по кредитам.

А еще в текст песни можно вставить метатеги — то есть в квадратных скобках указать, где начинается припев и когда заканчивается трек. Это необязательно, но помогает добиться более точного результата. Например, я попыталась создать лиричную рок⁠-⁠балладу «Чипи⁠-⁠чипи чапа⁠-⁠чапа», и она закончилась очень резко. Чтобы этого избежать, пришлось разобраться, в чем проблема. Оказалось, лучше поставить тег для завершения композиции.

Я попробовала отредактировать трек по кнопке Studio. Откроется меню, напоминающее диджейский пульт с тумблерами для изменения настроения — по умолчанию они все на нуле. В этой же вкладке я увеличила продолжительность трека. Однако сделать трек инструментами сервиса веселее не вышло. Без подписки сохранить его нельзя.

Качество генерации: 🎵🎵🎵🎵
Что умеет: накладывать эффекты, смешивать треки или создавать треки с нуля по заданным параметрам, редактировать их и генерировать музыку по текстовому запросу
Лимиты: бесплатно 25 треков до 30 секунд в месяц, но нельзя скачать
Платные функции: от 10 $⁣ ( 878 ₽) за 300 песен длительностью до 3,5 минуты в месяц, но российской картой оплатить нельзя

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь