Содержание статьи
Нейросеть которая изменяет голос в песне
Интересное
Fish Audio — нейросеть для озвучки текста. Платформа предлагает возможность создания голосов из небольших аудиозаписей. Также можно использовать модели, созданные другими пользователями. Нейросеть способна озвучить текст на русском, английском, немецком и других языках. Доступно внедрение AI-инструмента с помощью API.
Шаг 6. Поочередно запустите ячейки Check GPU, Setup 1, Setup 2, Download ContentVec, Setup HF Downloads. Для этого нужно нажать кнопку Play возле соответствующего заголовка. Когда код загрузится, возле названия ячейки появится зеленая галочка. Запускайте следующую ячейку, только когда закончится загрузка предыдущей. Если вы пропустите одну из строчек, программа не сработает.
Дольше всего загружается Setup 1 — около 10 минут. Остальным требуется несколько секунд. Вам не придется загружать код для каждого трека, достаточно сделать это один раз. Но спустя примерно два часа код автоматически сбросится. В таком случае придется начинать весь процесс заново.
Шаг 4. Выберите один из предложенных голосов. На сайте доступны вокалы Арианы Гранде, Дрейка, Граймс, Канье Уэста, Трэвиса Скотта и других. Есть два персонажа мультфильмов — Губка Боб Квадратные Штаны и Питер Гриффин. При этом все эти голоса могут воспроизводить русскоязычный текст.
История про трек разошлась, и позже его удалили со всех площадок по требованию правообладателя Universal. Но в соцсетях стали появляться другие коллаборации: голосом Фредди Меркьюри исполнили песню Imagine Dragons, а Канье Уэст «спел» Just The Two of Us. Тренд добрался и до рунета: песни стали перепевать голосами Доры и Элджея. А ИИ-каверы нейро-Моргенштерна сильно разошлись в «Тиктоке».
OpenVoice — нейросеть для копирования голоса на русском, английском, немецком и множестве других языков. Модель отличается тем, что требует всего лишь небольшой аудиозаписи для воспроизведения голоса на нескольких языках. OpenVoice позволяет детально контролировать стили голоса, включая эмоции, акцент, ритм, паузы и интонацию.
OpenVoice
Музыка защищена авторским правом, поэтому использовать в коммерческих целях ее нельзя. Будьте готовы к тому, что ваш сгенерированный трек могут удалить с «Ютуба» или других платформ по требованию правообладателя. Либо выбирайте песни, доступные по лицензии Creative Commons.
Voicemod — нейросеть, меняющая голос в реальном времени. Сервис выделяется поддержкой большого количества программ, высоким качеством звука, возможностью создавать собственные голоса и простотой настройки. Кроме того, в Pro-версии доступна огромная библиотека пользовательских голосов, которые вы можете использовать.
Шаг 9. Нажмите на иконку папки и перетащите в пустое пространство аудиофайл с а капеллой в формате wav, который вы подготовили в третьем шаге. Загрузка файла может занять несколько минут — все зависит от его длины. Когда файл загрузится, запустите код.
FineVoice — нейросеть для изменения голоса. Не снижает качество исходного файла. Преимуществом сервиса является большой набор голосов (стандартных и созданных сообществом) и возможность обучить модель на своём аудиофайле или записи для создания нового голоса. Кроме того, присутствует возможность синтеза речи и транскрибации.
Шаг 7. Выберите голос, который будет исполнять вашу песню. Для этого под заголовком Other Downloads (.zip) Step o.1 найдите поле model_url и добавьте туда ссылку на папку с моделью голоса. Ссылки можно взять из списка предложенных в этой же ячейке: Канье Вест, Кендрик Ламар, Дрейк.
Нет зарубежной банковской карты? Вы можете выгодно оплатить подписку на иностранный сервис с помощью GetPayAll с минимальной комиссией на рынке. Назовите менеджеру промокод neural для получения скидки 30% на комиссию при первой оплате.
Компания работает как с физическими, так и с юридическими лицами. Помимо оплаты зарубежных сервисов, предлагается выпуск индивидуальной карты с возможностью пополнения.
Neural-Networked – ваш проводник в мире нейронных сетей. Наш сайт-каталог предлагает удобный доступ к широкому спектру нейросетевых моделей, чтобы помочь вам воплотить свои идеи в жизнь. Используйте удобные фильтры и поиск для выбора подходящего инструмента.
Способ, не требующий навыков программирования или мощного компьютера: воспользоваться нейросетью на Google Colab. Полностью готовый ИИ-кавер можно сделать примерно за полчаса. Сгенерировать песню можно с голосом исполнителя, чью модель выложили в открытый доступ энтузиасты.