Нейросети

Нейросеть которая подделывает голоса

17.12.2022

Содержание

Как сделать ИИ-кавер при помощи нейросети

Кратко: какой способ выбрать

Способ, не требующий навыков программирования или мощного компьютера: воспользоваться нейросетью на Google Colab. Полностью готовый ИИ-кавер можно сделать примерно за полчаса. Сгенерировать песню можно с голосом исполнителя, чью модель выложили в открытый доступ энтузиасты.

Шаг 7. Выберите голос, который будет исполнять вашу песню. Для этого под заголовком Other Downloads (.zip) Step o.1 найдите поле model_url и добавьте туда ссылку на папку с моделью голоса. Ссылки можно взять из списка предложенных в этой же ячейке: Канье Вест, Кендрик Ламар, Дрейк.

Шаг 4. Выберите один из предложенных голосов. На сайте доступны вокалы Арианы Гранде, Дрейка, Граймс, Канье Уэста, Трэвиса Скотта и других. Есть два персонажа мультфильмов — Губка Боб Квадратные Штаны и Питер Гриффин. При этом все эти голоса могут воспроизводить русскоязычный текст.

Musicfy позволяет генерировать треки гораздо проще: с коротким ожиданием, без запуска кода и возможности столкнуться с ошибками. С этим способом даже не требуется конвертировать аудиофайлы. Главный минус — на сайте представлен ограниченный набор голосов.

Шаг 9. Нажмите на иконку папки и перетащите в пустое пространство аудиофайл с а капеллой в формате wav, который вы подготовили в третьем шаге. Загрузка файла может занять несколько минут — все зависит от его длины. Когда файл загрузится, запустите код.

История про трек разошлась, и позже его удалили со всех площадок по требованию правообладателя Universal. Но в соцсетях стали появляться другие коллаборации: голосом Фредди Меркьюри исполнили песню Imagine Dragons, а Канье Уэст «спел» Just The Two of Us. Тренд добрался и до рунета: песни стали перепевать голосами Доры и Элджея. А ИИ-каверы нейро-Моргенштерна сильно разошлись в «Тиктоке».

Самые естественные голоса в мире

Дольше всего загружается Setup 1 — около 10 минут. Остальным требуется несколько секунд. Вам не придется загружать код для каждого трека, достаточно сделать это один раз. Но спустя примерно два часа код автоматически сбросится. В таком случае придется начинать весь процесс заново.

Нейросеть из Google Colab позволяет сгенерировать трек сотней голосов, модели которых сделали пользователи. Этот способ затратен по времени: нужно ждать загрузки кода, часто он выдает ошибки. Разобраться в причинах с ходу сложно — сервис не говорит, в чем именно проблема. Порой приходится проводить время на форумах и «Ютубе», чтобы устранить ошибку — а через пять минут наткнуться уже на новую.

ЧИТАТЬ ТАКЖЕ: Тома питерса стратегия совершенства как добиться успеха в эпоху перемен и искусственного интеллекта

Музыка защищена авторским правом, поэтому использовать в коммерческих целях ее нельзя. Будьте готовы к тому, что ваш сгенерированный трек могут удалить с «Ютуба» или других платформ по требованию правообладателя. Либо выбирайте песни, доступные по лицензии Creative Commons.

Присоединяйтесь к более чем 2 000 000 пользователей, которым нравится LOVO AI. Наше отмеченное наградами программное обеспечение для генерации голоса и преобразования текста в речь содержит 500+ голосов на 100 языках. Создавайте увлекательные видеоролики с голосом для маркетинга, обучения, социальных сетей и многого другого!

Все, что вам нужно для озвучивания и создания видео — сценарии, сверхреалистичные голоса, изображения, монтаж и многое другое! Genny обладает всеми необходимыми функциями для создания увлекательных видеороликов с интегрированными функциями искусственного интеллекта.

Шаг 6. Поочередно запустите ячейки Check GPU, Setup 1, Setup 2, Download ContentVec, Setup HF Downloads. Для этого нужно нажать кнопку Play возле соответствующего заголовка. Когда код загрузится, возле названия ячейки появится зеленая галочка. Запускайте следующую ячейку, только когда закончится загрузка предыдущей. Если вы пропустите одну из строчек, программа не сработает.

LOVO — это самый продвинутый генератор искусственного голоса и преобразования текста в речь, доступный на рынке. С LOVO вы сможете сэкономить тысячи долларов и часы времени на создании реалистичных и высококачественных закадровых голосов. Наша передовая технология позволяет создавать суперреалистичные голоса, которые практически невозможно отличить от настоящих человеческих голосов. Простой в использовании профессиональный пользовательский интерфейс делает создание закадрового голоса легкой задачей даже для тех, кто не имеет опыта работы с аудио. LOVO идеально подходит для компаний, создателей контента, преподавателей и всех, кто хочет создавать интересный контент, выделяющийся из толпы. LOVO призван упростить процесс создания контента, чтобы вы могли сосредоточиться на главном — донесении информации до аудитории. С LOVO вы получите доступ к обширной библиотеке голосов, языков и акцентов, что позволит вам найти идеальный голос, соответствующий вашему бренду или проекту.

Как сделать ИИ-кавер при помощи нейросети

Кратко: какой способ выбрать

Самые естественные голоса в мире

ОСТАВЬТЕ ОТВЕТ Отменить ответ

ЭТО ПОПУЛЯРНО

ЭТО ИНТЕРЕСНО

ВЫБОР РЕДАКТОРА