Как обучить нейросеть говорить

0
9

Завести ИИ-друга: 9 бесплатных нейросетей для общения

Pi

Человечность диалога: ❤️❤️❤️
Для кого: для тех, кто хочет поговорить с базовой GPT-3 и персонажами в одном месте
Языки: русский, английский
Стоимость: бесплатно
Где попробовать: на сайте или в приложение для iOS

Один из самых популярных ботов на сайте — Марио из игры Super Mario 64. С ним общается 28 миллионов человек. Вначале он запускает квест по Грибному королевству, но его можно отключить, если перевести разговор на другую тему. При этом темы перетекают из одной в другую естественно и непринужденно. У сантехника есть интересы и мнения по разным этическим вопросам, он испытывает эмоции и может говорить о своем отношении к другим персонажам вселенной. И даже сам задает наводящие вопросы, если диалог заходит в тупик.

Для этих целей некоторые компании привлекают к решению задач собственных операторов (если есть свободные ресурсы) или передают работу на аутсорсинг профильным исполнителям. Чем больше проверок проходит датасет, тем точнее будет впоследствии работать искусственный интеллект, тем эффективнее чат-бот сможет обрабатывать запросы клиентов.

Вся работа проводится на базе облачной платформы Beorg Smart Vision, собственной разработки компании Биорг. К платформе удаленно подключены тысячи операторов, имеющих навыки разметки и верификации данных и участвующих в проектах компании, в том числе федеральных, где сложность обработки данных превышает возможности нейросетей и требуется подключать человека для верификации сложных данных.

Давайте внимательно посмотрим на него. Вышенаписанная формула — это не что иное, как определение умножения матрицы на вектор. И в самом деле, если мы возьмем матрицу W размера n на m и выполним ее умножение на X размерности m, то мы получим другое векторное значение n-размерности, то есть как раз то, что надо.

Если купить подписку, то с виртуальным компаньоном можно даже «встречаться». Раньше это было основной фишкой приложения: пользователи платили деньги, чтобы заниматься секстингом с ИИ. Однако после скандала такую возможность отключили. Из-за этого, по словам бывших пользователей, алгоритм ухудшился.

Paradot

Среди «безопасных» ботов популярен главный герой «Гравити Фолз» Диппер Пайнс — с ним общаются более 800 тысяч человек. Беседа проходит достаточно естественно, бот задает вопросы, поддерживает тему и распознает контекст. У ботов Chai есть база знаний о реальном мире: я поговорила с Диппером о поп-культуре , и он не ошибался в фактах.

Однако у нейросети плохо с «памятью»: она не запоминает то, что вы говорили ботам в предыдущем сообщении, и они не могут пересказать факт. Персонажи также могут иногда перескакивать с темы на тему и выходить из образа. Например, когда я пожаловалась на работу, Диппер почему-то решил, что я работаю на него, и грозился меня уволить. Но такие забавные ситуации могут вызывать желание продолжать общаться.

Говоря проще, ИНС можно назвать неким «черным ящиком», превращающим входные данные в выходные данные. Если же посмотреть на это с точки зрения математики, то речь идет о том, чтобы отобразить пространство входных X-признаков в пространство выходных Y-признаков: X → Y. Таким образом, нам надо найти некую F-функцию, которая сможет выполнить данное преобразование. На первом этапе этой информации достаточно в качестве основы.

Под искусственной нейронной сетью (ИНС) понимают математическую модель (включая ее программное либо аппаратное воплощение), которая построена и работает по принципу функционирования биологических нейросетей — речь идет о нейронных сетях нервных клеток живых организмов.

Последовательность нейрослоев часто применяют для более глубокого обучения нейронной сети и большей формализации имеющихся данных. Именно поэтому, чтобы получить итоговый выходной вектор, нужно проделать вышеописанную операцию пару раз подряд по направлению от одного слоя к другому. В результате для 1-го слоя входным вектором будет являться X, а для последующих входом будет выход предыдущего слоя. То есть нейронная сеть может выглядеть следующим образом:

ЧИТАТЬ ТАКЖЕ:  Как с помощью нейросети написать песню

Один нейрон может превратить в одну точку входной вектор, но по условию мы желаем получить несколько точек, т. к. выходное Y способно иметь произвольную размерность, которая определяется лишь ситуацией (один выход для XOR, десять выходов, чтобы определить принадлежность к одному из десяти классов, и так далее). Каким же образом получить n точек? На деле все просто: для получения n выходных значений, надо задействовать не один нейрон, а n. В результате для каждого элемента выходного Y будет использовано n разных взвешенных сумм от X. В итоге мы придем к следующему соотношению:

Обновление весовых коэффициентов

Дабы найти значение ошибки E, надо найти сумму квадратов разности векторных значений, которые были выданы нейронной сетью в виде ответа, а также вектора, который ожидается увидеть при обучении. Еще надо будет найти дельту каждого слоя и учесть, что для последнего слоя дельта будет равняться векторной разности фактического и ожидаемого результатов, покомпонентно умноженной на векторное значение производных последнего слоя:

При этом есть как специализированные сервисы-собеседники, так и мультифункциональные нейросети, которых можно обучить подражать человеческому стилю общения. Они поддержат беседу, помогут попрактиковаться в иностранном языке, выслушают и примут на себя любую роль.

Недавно специалисты из Gartner* спрогнозировали, что в 2022 году 70% всех коммуникаций с клиентами в сервисных индустриях будет происходить при помощи ИИ. Предпосылки для этого есть. По оценкам экспертов, уже сегодня около 60% коммуникаций бизнеса с клиентами не требуют участия человека. Все больше банков, телеком-операторов и других сервисных организаций используют искусственный интеллект для обработки входящих запросов. Без машинного обучения и цифровых «личностей» вскоре не обойдется ни один контакт-центр. Однако довести такие коммуникации до совершенства удается не всем.

Многие ИИ механически отвечают на вопросы и не распознают контекст беседы. Либо же отвечают слишком неестественно — с такими поговорить по душам не получится. Даже у продвинутых нейросетей есть ограничения: например, Bing AI после пары десятков сообщений напрочь забывает вас и ваши разговоры.

Получить четкий ответ от робота можно только на стандартный вопрос — например, узнать баланс счета и т.д. Если вопрос формулировка звучит иначе, например, «почему на моем балансе минус, если я вчера положил на счет 500 рублей», то с высокой вероятностью бот озвучит либо тот же самый ответ, либо предложит самостоятельно посмотреть баланс в личном кабинете.

По моему опыту, разговоры с репликой совсем не похожи на общение с настоящим человеком. Бот отвечает короткими фразами или заготовленными скриптами. Он во всем с вами соглашается, не имеет убеждений и мировоззрения, выдумывает странные факты, упоминает несуществующий контент. Судя по всему, в базе приложения мало информации из реального мира.

Еще у приложения много рекламы: пятисекундные баннеры открываются, когда переключаешься между ботами или просто общаешься в чате. Есть ограничение на 70 сообщений каждые два часа. Если сообщения закончатся, то вам предложат купить подписку, которая снимает лимиты и убирает рекламу.

Интерфейс минималистичен. Никаких настроек в нем нет, кроме возможности выбрать голос. Вы сразу и без регистрации начинаете разговаривать с Pi. Рекомендую общаться на английском, потому что на русском он говорит очень плохо. Хуже, чем если бы текст прогоняли через « Гугл-переводчик », поэтому даже не стоит пытаться.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь