Содержание статьи
Как сделать ИИ-кавер при помощи нейросети
MusicAI обзор
Musicfy позволяет генерировать треки гораздо проще: с коротким ожиданием, без запуска кода и возможности столкнуться с ошибками. С этим способом даже не требуется конвертировать аудиофайлы. Главный минус — на сайте представлен ограниченный набор голосов.
История про трек разошлась, и позже его удалили со всех площадок по требованию правообладателя Universal. Но в соцсетях стали появляться другие коллаборации: голосом Фредди Меркьюри исполнили песню Imagine Dragons, а Канье Уэст «спел» Just The Two of Us. Тренд добрался и до рунета: песни стали перепевать голосами Доры и Элджея. А ИИ-каверы нейро-Моргенштерна сильно разошлись в «Тиктоке».
Музыка защищена авторским правом, поэтому использовать в коммерческих целях ее нельзя. Будьте готовы к тому, что ваш сгенерированный трек могут удалить с «Ютуба» или других платформ по требованию правообладателя. Либо выбирайте песни, доступные по лицензии Creative Commons.
Дольше всего загружается Setup 1 — около 10 минут. Остальным требуется несколько секунд. Вам не придется загружать код для каждого трека, достаточно сделать это один раз. Но спустя примерно два часа код автоматически сбросится. В таком случае придется начинать весь процесс заново.
Шаг 6. Поочередно запустите ячейки Check GPU, Setup 1, Setup 2, Download ContentVec, Setup HF Downloads. Для этого нужно нажать кнопку Play возле соответствующего заголовка. Когда код загрузится, возле названия ячейки появится зеленая галочка. Запускайте следующую ячейку, только когда закончится загрузка предыдущей. Если вы пропустите одну из строчек, программа не сработает.
Это тоже программа, как и предбудущая нейронка. Тоже занимается клонированием голосов и каверами. В арсенале имеется 46 языков и база из 3200 голосов. Имеется встроенный редактор звука. В базе есть голос Губки Боба, Оптимуса Прайда, Байдена и других политиков или бывших политиков. Достаточно глубокий и проработанный интерфейс программы.
Нейросеть из Google Colab позволяет сгенерировать трек сотней голосов, модели которых сделали пользователи. Этот способ затратен по времени: нужно ждать загрузки кода, часто он выдает ошибки. Разобраться в причинах с ходу сложно — сервис не говорит, в чем именно проблема. Порой приходится проводить время на форумах и «Ютубе», чтобы устранить ошибку — а через пять минут наткнуться уже на новую.
Само выражение «поют песни голосом» (т.е. каверы) звучит, как-то странно. Какой-то код, сайт может петь по-человечески, задумаетесь вы, а нет, может и ещё как. Применяя особые алгоритмы обученные нейросети могут озвучить любую песню, причем можно даже задать тонкие характеристики для звучания.
Шаг 4. Выберите один из предложенных голосов. На сайте доступны вокалы Арианы Гранде, Дрейка, Граймс, Канье Уэста, Трэвиса Скотта и других. Есть два персонажа мультфильмов — Губка Боб Квадратные Штаны и Питер Гриффин. При этом все эти голоса могут воспроизводить русскоязычный текст.
Шаг 9. Нажмите на иконку папки и перетащите в пустое пространство аудиофайл с а капеллой в формате wav, который вы подготовили в третьем шаге. Загрузка файла может занять несколько минут — все зависит от его длины. Когда файл загрузится, запустите код.
Хотите озвучить свою кавер голосом какого-то актера, персонажа — нейросеть Fineshare то приложение, которое может вам позволить. Помимо него в сети есть поющие каверы приложения и вебсайты. Вообще нейросетей, которые могут подстроить пение вашей песни или стихов под музыку голосом какого-либо аватара масса. О всех них говорить бессмысленно вы и сами сможете найти их в сети. Мы расскажем о функционале четырех из них.
Шаг 7. Выберите голос, который будет исполнять вашу песню. Для этого под заголовком Other Downloads (.zip) Step o.1 найдите поле model_url и добавьте туда ссылку на папку с моделью голоса. Ссылки можно взять из списка предложенных в этой же ячейке: Канье Вест, Кендрик Ламар, Дрейк.
MusicAI — это программа — генератор треков, может переозвучить песню одним из героев модель которого закачана в нейросеть. От вас требуется сама песня, которую нужно будет загрузить на сервис. Как указано на ресурсе, использовать коммерчески треки пока нельзя.
Способ, не требующий навыков программирования или мощного компьютера: воспользоваться нейросетью на Google Colab. Полностью готовый ИИ-кавер можно сделать примерно за полчаса. Сгенерировать песню можно с голосом исполнителя, чью модель выложили в открытый доступ энтузиасты.