Содержание статьи
Нейросеть которая может говорить твоим голосом
Существует лучший способ создания закадрового голоса
Спасибо, что поделились этим. Мне нравится эта функция. Я только что написал вам в Твиттере о том, как мне это нравится. Голос замечательный и совсем не похож на текст в речь, который я привык слушать. Я подкастер и думаю, что это поможет многим людям работать в режиме многозадачности, особенно если их прерывают входящие сообщения электронной почты или что-то еще. Вы можете читать параллельно, но продолжать чтение, если ваши глаза должны пойти в другое место. Надеюсь, вы сохраните это. Это уже есть в других веб-публикациях. Я также вижу это на некоторых новостных сайтах. Так что я думаю, что это может стать стандартом, которого ожидают читатели, когда читают онлайн. Могу ли я проголосовать дважды?
Привет, Уоррен, я один из тех немногих, случайно выбранных людей, и мне АБСОЛЮТНО нравится эта функция. Я использовал больше идей, чем когда-либо на Medium. А еще, как не носитель английского языка, это очень помогает мне улучшить произношение. Сохраните это навсегда! С любовью, Ананья:)
Для меня это самая важная функция, которую вы можете реализовать. У меня просто нет времени читать все статьи, которые я хотел бы прочитать на Medium. Если бы я мог слушать статьи, я бы мог потреблять по крайней мере в 3 раза больше контента Medium, чем сейчас.
Voice Engine сейчас тестируют на небольших группах людей. И хотя ее создатели опасаются, что их детище попадет в руки мошенников, они в итоге намерены сделать новинку доступной и безопасной для массового пользования. Ведь она может стать полезной во многих сферах жизни.
Хотя эта технология не нова (ее разработали в конце 2022 года), возможности Voice Engine впечатляют. Например, с помощью нейросети девушка, которая потеряла способность нормально говорить из-за сосудистой опухоли головного мозга, теперь вновь может общаться своим привычным голосом. Для этого разработчики использовали звуковую запись, которую она когда-то сделала для школьного проекта.
Также Voice Engine пригодится тем, кто общается жестами. Существуют приложения с искусственным интеллектом, которые позволяют коммуницировать людям с ограниченными возможностями. Используя новую нейросеть, они могут выбирать из числа уникальных, нероботизированных голосов.
Используйте искусственный интеллект для создания закадрового голоса
Например, в обучении маленьких детей, школьников и студентов. На образовательных интернет-платформах можно найти массу курсов, и если их будет читать не механический, а естественно звучащий голос, слушать такие лекции будет намного приятнее. А значит, усваивать материал будет проще. OpenAI уже заключила контракт с одной из таких компаний, которая раньше занималась программами для обучения детей чтению и математике. Теперь с помощью Voice Engine и GPT-4 они разработали и другие курсы — например, по химии и физике.
Охват глобальных данных и небольших сообществ. В компании Dimagi, занимающейся разработкой мобильных приложений для сбора, хранения и обработки статической информации в здравоохранении, тоже заинтересовались Voice Engine. Там начали применять ее для интерактивной обратной связи с медработниками в удаленных уголках планеты. А еще для создания обучающих роликов (например, по грудному вскармливанию младенцев) на редких языках. Только в Кении насчитывается 68 диалектов, и каждая община говорит на своем. Яркий пример — шэн — смесь английского и суахили.
Я только что начал чаще пользоваться Medium, и мне очень нравится эта функция. Я слушал свои собственные истории, и Эл делает интонации точно так же, как я. Многие жалуются, что не могут читать свои истории, но давайте будем честными. Сколько историй обошлось бы без аудиоверсии, если бы вам пришлось озвучивать их самостоятельно? Я, безусловно, ценю это. Спасибо за это.
Кроме того, с помощью Voice Engine можно переводить текст. Нейросеть способна воспроизводить голос человека не только на его родном языке, но и на любых других, при этом сохраняя акцент. Например, если франкоговорящий захочет создать аудио на английском языке, ИИ сгенерирует запись с французским произношением. Так, в компании HeyGen, которая специализируется на создании маркетинговых образов и аватаров, Voice Engine используют для перевода видеороликов. Английскую речь там трансформируют в испанскую, китайскую, немецкую, французскую, японскую. И все это голосом одной женщины.
С помощью API Speechify мы можем предложить нашим пользователям новый и доступный способ потребления нашего контента. Мы заметили, что читатели, которые предпочитают слушать статьи с помощью Speechify, в среднем на 20% более вовлечены, чем пользователи, которые предпочитают не слушать.
При всей пользе Voice Engine критики по всему миру все же обеспокоены последними тенденциями. Речь о том, что ИИ способен создавать фальшивые видео- и аудиозаписи. В OpenAI заверяют, что сейчас все, кто тестирует их новинку, подписывают соглашение, в котором запрещено использовать любые голоса без письменного разрешения разработчика. При этом компании обязаны сообщать своей аудитории, что голоса, которые они слышат, генерирует искусственный интеллект. Наконец, OpenAI внедрила «водяные знаки», которые позволяют определить происхождение любого звука, создаваемого Voice Engine.