Как сделать голос персонажа с помощью нейросети

0
15

Нейросеть меняющая голос — список из 11 сайтов

Об авторе

Эх ладно я нашел живой гайд и живой коллаб по которому уже успешно обучаю) Дам ссылки тута
Инструкция по обучению увы токмо на ангельском но с картинками! https://youtu.be/x-jelyl6dyE
Коллаб для тренировки по этой инструкции https://colab.research.google.com/drive/1TU-kkQWVf-PLO_hSa2QCMZS1XF5xVHqs#scrollTo=MErtbNbp4wn0
Коллаб живой и рабочий остальное что находил нерабочий мусор.
Да суперкомпы гугла бесплатно попашут на вас 3 часа в сутки мощей стоимостью в пару миллионов)

Почему у всех в описании так всё просто? Запустите и работайте 🙂 Так она не запускается просто. Моя система Win7 64, видео АМД, 32 память. При запуске не может загрузить модуль cudart64_110.dll, который точно есть. И нигде никто не пишет, как это можно исправить. Или, какие требования, чтоб RVC точно работала :(((

Altered Studio — это аудиоредактор следующего поколения, который объединяет несколько технологий редактирования голоса в единое удобное приложение. Он работает как онлайн, так и локально на Windows и Mac. Тут имеются инструменты для транскрибирования, озвучивания, преобразования текста в речь и переводы. Одна из опций позволяет видоизменять голос.

Отдельно отмечу что по крайней мере для SVC не все эпохи одинаково полезны)
Лучше тестить промежуточные итерации (я сохраняю каждую 1000ю потому говорю за них) скажем 42000 шаг может звучать с откровенный металлическим голосом робота работая хуже чем 16000й а тем временем 41000 был идеален о_о а 40000 тоже мусор.
Металл кстати многое прощает! Как раз плотное музло скрывает многие косяки) Голос понизил в редакторе на децибел и ваще хорошо стало)
А вот с простым музлом типа голоса под гитару засада) косяки как на ладони — их нечем маскировать!
Естественно всё это зависит от того чей голос куда натягивать)
Когото проще когото сложнее.
Это индивидуально даже не для каждого исполнителя а для для каждой песни.

3. Чтобы программа могла воссоздать полноценную музыкальную композицию с интересующем нас голосом, необходимо заранее подготовить голосовую модель и отделить вокал солиста от инструментала в интересующей нас композиции. В общем, чтобы голос стал отдельно от музыки.

Genny позволяет вам выбирать из более чем 500 голосов искусственного интеллекта на более чем 20 эмоциях и более чем 150 языках, в том числе и русский. Голоса — это голоса профессионального уровня, которые звучат по-человечески и реалистично. Вы можете использовать редактор произношения, управление акцентом, скоростью и высотой тона, чтобы усовершенствовать свою речь и настроить то, как вы хотите, чтобы она звучала.

Отдельно дополню для тех кто попробует натянуть на экстремальный вокал — чистый голос
Возможны неприятные открытия типа экстрим вокалиста орущего мимо нот но при экстрим вокале это было нормально а на чистом звучит как испанский стыд))
Ещё обнажается хреновое качество записи или недостаточная тренировка модели (не только малое количество эпох но и неудачно собранный датасет для тренировки с однообразным или слишком небольшим по количеству материалом) — слова могут звучать неразборчиво.
Ну и на совсем высоком скриме или шрайке уменьшайте питч иначе чистым голосом будет совсем шептать)

ЧИТАТЬ ТАКЖЕ:  Как в фотошопе включить нейросеть

Дополню что собирать музло обратно гораздо удобнее во FL Studio
А Отковыривать голос и музыку отдельно в Ultimate Vocal Remover
ЗЫ я хз как комент сюда попал вместо того чтобы пойти вниз… ну да ладно.
По теме отвечу что для телефона есть гугл коллаб он всё за телефон сделает по быстрому)
Но это огромная тема есть на ютубе lunnaholy он инструкции подробные снимал для бедолаг с телефонами

Apihost.ru

У вас есть трек или какая-то запись и вы хотите заменить голос с помощью нейросети — смело читайте статью и пробуйте ниже приведенные нейросети меняющие голос. При помощи их можно изменять голос музыканта в песне, исполнителя любого фильма и ролика. В общем, всё что можно сделать со звуком.

С появлением передовых технологий искусственного интеллекта и синтеза голоса на рынке появилось множество компьютерных генераторов голоса. Эти быстрые достижения также сделали ненужным использование больших объемов голосовых сэмплов или высокопрофессионального оборудования.

Сервис предоставляет широкий выбор голосов, постоянно совершенствуя свои модели синтеза голоса. LOVO недавно запустила Genny, генератор голоса искусственного интеллекта нового поколения, оснащенный функциями преобразования текста в речь и редактирования видео. Он может воспроизводить голоса, похожие на человеческие, с потрясающим качеством, а создатели контента могут одновременно редактировать свое видео.

RVC-GUI — это удобная оболочка с открытым исходным кодом созданная для упрощения управления параметрами нейронной сети RVC применяемой для синтеза любого голоса/музыкальной композиции. По сравнению с аналогами, не требует установки и настройки сложных библиотек или использования Linux. Для работы программы достаточно Windows 10/11 и относительно современного ПК.

Так это обычная демонстрация, что в итоге получится. Ссылки указаны на оригинал под видео и в самом видео. Присмотритесь. Не говоря уже о том, что я дополнил видео и создаю в видеоредакторе совершенно другую композицию. Гайд структрурирован и дополнен для ixbt/live.
____________________
https://sun9-68.userapi.com/impg/kd6PbLiwqeZXUQUaGrhvfO7RzOsKtzyNKRdvrA/nqmmeGHt7uM.jpg?size=408×799&quality=96&sign=732996bb6c0bcb3d8034bd250d444997&type=album
_____________________
https://sun9-44.userapi.com/impg/xPuiy1N3LeDzaej6LE9FLz5RQ5zA7jnLboEJng/hXQC4cymEEI.jpg?size=1118×211&quality=95&sign=6aa0749ba4a3e0c6e2520597d41d4f62&type=album

Мощный генератор Play.ht преобразования текста в речь с помощью нейросети. Может клонировать и изменять голоса. Можно загружать закадровый текст в формате MP3 и WAV-файлов. Возможность создавать голосовые виджеты для сайтов и переводить текст в речь мужскими и женскими голосами.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь