Как сделать голос с помощью нейросетей

0
14

Нейросети для озвучки текста на русском языке: 8 программ с бесплатными опциями

Murf

Если вы хотите пойти дальше и работать с более длинными текстами, а еще и добавлять к ним эмоции, придется зарегистрироваться. Правда, после сервис попросит вас оплатить хотя бы минимальное количество символов, чтобы озвучить текст. Из интересного — можно сохранять голоса в избранное и менять их эмоцию. Доступно всего два варианта: Neutral и Robot.

Всего доступно 29 русскоязычных голосов. Они достаточно разнообразны, текст озвучивается без ошибок и даже с правильной интонацией, но сильно ощущается неестественность. Есть даже отдельный Максим-бот, чей голос вам точно знаком по сотням роликов с YouTube и TikTok. Мои фавориты — Захар, Полина, Дария.

Российский сервис с семью версиями нейросети, которые различаются лимитом по символам и количеством голосов. Например, в V1 — 1000 символов и 17 голосов, в V2 — уже 500 символов и 20 голосов. Модели различаются по качеству генерации, набору эмоций, скорости обработки.

Предварительно можно послушать, как звучат голоса. Русскоговорящих всего 24, но они роботизированные — не хватает выразительности и эмоциональности. Из всех мне понравились только три: Ольга, Владимир и Галина. Помимо голоса по кнопке «Больше опций» можно настроить параметры: выбрать громкость, скорость и формат аудио — M4A, MP3, WAV.

Чтобы озвучить текст, введите его в поле, выберите язык, голос и настройки — высоту, частоту, паузу предложений, параграфов и скорость. Под полем для ввода есть подробные инструкции, как размечать текст, — воспользуйтесь ими. Можно даже сгенерировать диалог между разными голосами. Нажмите на «Озвучить текст».

Здравствуйте, не пойму что нужно делать, к примеру я хочу заменить песенку про мамонтенка, голосом Розенбаума, мои действия какие должны быть. 1) взять песенку мамонтенка и сделать один вокал или наоборот один Розенбаум. 2)где мне брать модель под мамонтёнка в формате RVC/RVC2, 3) МОЖНО пожалуйста дополнить инструкцию.

53 комментария

Почему у всех в описании так всё просто? Запустите и работайте 🙂 Так она не запускается просто. Моя система Win7 64, видео АМД, 32 память. При запуске не может загрузить модуль cudart64_110.dll, который точно есть. И нигде никто не пишет, как это можно исправить. Или, какие требования, чтоб RVC точно работала :(((

Дополню что собирать музло обратно гораздо удобнее во FL Studio
А Отковыривать голос и музыку отдельно в Ultimate Vocal Remover
ЗЫ я хз как комент сюда попал вместо того чтобы пойти вниз… ну да ладно.
По теме отвечу что для телефона есть гугл коллаб он всё за телефон сделает по быстрому)
Но это огромная тема есть на ютубе lunnaholy он инструкции подробные снимал для бедолаг с телефонами

ЧИТАТЬ ТАКЖЕ:  Как искусственный интеллект влияет на нашу жизнь кратко

Скажу откровенно, меня пугает уровень развития современных технологий. Но кроме страха я ощущаю ещё и надежду. Надежду на то, что человечество может и не искоренит свои пороки, но благодаря развитию технологий подарит утешение миллионам людей по всему миру. Уважайте свободу, используйте свободное ПО и ни в коем случае не предавайте себя!

1. Количество эпох это степень обучения модели, больше>лучше. 41.6k — это качество дискретизации, больше>лучше.
2. Модели есть, но их нужно ещё поискать. В основном все их обучают сами и мало кто делится в итоге. Погуглите модели или гайд по обучению. Я хотел продолжить гайд обучением, но обнаружил, что это мало кому интересно. В общем, решил не тратить силы.

Отдельно дополню для тех кто попробует натянуть на экстремальный вокал — чистый голос
Возможны неприятные открытия типа экстрим вокалиста орущего мимо нот но при экстрим вокале это было нормально а на чистом звучит как испанский стыд))
Ещё обнажается хреновое качество записи или недостаточная тренировка модели (не только малое количество эпох но и неудачно собранный датасет для тренировки с однообразным или слишком небольшим по количеству материалом) — слова могут звучать неразборчиво.
Ну и на совсем высоком скриме или шрайке уменьшайте питч иначе чистым голосом будет совсем шептать)

Эх ладно я нашел живой гайд и живой коллаб по которому уже успешно обучаю) Дам ссылки тута
Инструкция по обучению увы токмо на ангельском но с картинками! https://youtu.be/x-jelyl6dyE
Коллаб для тренировки по этой инструкции https://colab.research.google.com/drive/1TU-kkQWVf-PLO_hSa2QCMZS1XF5xVHqs#scrollTo=MErtbNbp4wn0
Коллаб живой и рабочий остальное что находил нерабочий мусор.
Да суперкомпы гугла бесплатно попашут на вас 3 часа в сутки мощей стоимостью в пару миллионов)

Чтобы озвучить текст, напишите или скопируйте его, выберите настройки и нажмите «Озвучить». Результат можно скачать в MP3 и WAV. Не рекомендую регистрироваться на сайте, потому что Apihost сразу потребует оплатить подписку. Бесплатные попытки доступны только без регистрации.

Из настроек есть: высота, скорость, паузы. Также в личном кабинете можно сохранять голоса в избранное. Мне показалось, что сервис больше подходит для личного использования. Например, прочитать анекдот и отправить это друзьям или поиграться с настройками голоса и понять, что вам нравится.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь