Содержание статьи
Сбер» начал работу над искусственным интеллектом для роботов
В конце прошлого года «Сбер» представил новую стратегию. Из нее следует, что в 2024–2026 годах Сбербанк намерен перейти на «человекоцентричную бизнес-модель» и развивать искусственный интеллект «нового поколения», говорил глава группы Герман Греф. По его словам, с помощью этой технологии «Сбер» переведет «большинство решений в онлайн», создаст «умного» помощника для клиентов, а также «демократизирует технологии». В следующие три года инвестиции банка в развитие искусственного интеллекта должны достичь 450 млрд руб. На данный момент у «Сбера» есть роботизированная система для автоматизации работы склада, робот-дезинфектор, а также робот-сомелье для презентации и продажи вин. Однако ничего из перечисленного нельзя назвать человекоподобными роботами. Исходя из описания вакансий, сооснователь и директор по развитию компании Promobot Олег Кивокурцев делает вывод, что «Сбер» ведет разработку собственного антропоморфного робота, при этом техническая часть достигла этапа прототипа, поскольку нужен специалист, который обучает робота шагающим движениям. «Кроме того, «Сбер» ведет крупный научно-исследовательский проект по разработке ИИ, который будет управлять разнообразными физическими воплощениями. Данный проект находится еще на этапе идеи, и концепция еще формируется. Эта разработка является перспективной, поскольку антропоморфные роботы активно разрабатываются и в США, и в Китае», — отметил Кивокурцев. Он привел данные ReportsnReports, по которым к 2023 году рынок человекоподобных роботов достигнет $3,9 млрд.
Технологии, на которых построены продукты, разработаны внутри SberDevices. В их основе — современные научные исследования и компоненты, созданные в компаниях экосистемы Сбер. Система распознавания и анализа речи, основанная на сверточных нейронных сетях и трансформерах, способна не только быстро и с рекордным качеством распознать речь пользователя, но и определять интонации и эмоциональную окраску речи. Это позволяет ассистентам Салют предоставлять сервисы, задействующие технологии «эмоциональных вычислений». Эти технологии — первый шаг в деле устранения эмоционального барьера между человеком и машиной.
Синтез речи — также собственная разработка Сбера. Система нейросетевого синтеза речи, основанная на рекуррентно-сверточной архитектуре Tacotron/Tacotron-2. Отбор целевых голосов для ассистентов Салют основан на научных исследованиях о привлекательности речи для слушателей.
Салют — это первое в мире семейство ассистентов с возможностью выбора близкого по духу персонажа, у которого есть свои имя, голос, характер и манера общения. Их трое: Сбер, Афина и Джой, и они могут не только поддержать разговор и найти ответы на вопросы, но и заказать еду, записать к доктору или в салон красоты, перевести деньги и оплатить мобильную связь.
Система нейросетевого синтеза речи SberDevices позволяет управлять ударениями, интонациями, темпом, смысловыми акцентами и даже эмоциональной окраской речи, а также использовать ряд специальных голосовых эффектов. Благодаря этому включенность во взаимодействие с пользователем выходит на новый уровень.
Москва, 24 сентября 2020. Сбер в рамках СберКонф представил семейство виртуальных ассистентов Салют. Его ключевые особенности — открытая платформа создания навыков, интеграция с экосистемой, финансовые скилы и развитая диалоговая платформа с тремя персонажами. С сегодняшнего дня Сбер постепенно запускает ассистентов в приложении Сбербанк Онлайн. Ассистенты Салют станут частью других экосистемных продуктов Сбера и умных устройств от SberDevices.
В устройствах и ассистентах от SberDevices реализованы и мощные технологии машинного зрения. Устройствами, оснащенными камерой, например, можно управлять при помощи жестов. Также пользователям доступны динамичные игры, основанные на движениях. Это достигается при помощи многослойной сверточной нейронной сети, работа которой происходит прямо на устройстве. Для этого «на борту» наиболее продвинутых устройств SberDevices размещен специальный нейросетевой процессор. Он же отвечает за распознавание ключевых слов, предназначенных для активации устройства.
Центр робототехники «Сбера» начал работу над искусственным интеллектом для роботов, который будет управлять «физическими воплощениями», например манипуляторами, мобильными колесными роботами, роботами-собаками и т.д. Об этом говорится в одной из вакансий на hh.ru, с которой ознакомился РБК. В ней отмечается, что в основу искусственного интеллекта ляжет большая мультимодальная нейронная сеть. Ей будут подчиняться фундаментальные модели навигации, манипуляции и планирования движений. Искусственный интеллект будет обучаться новому самостоятельно или по минимальному числу демонстраций. Упоминается, что обучение роботов — часть проекта по созданию собственного антропоморфного, то есть человекоподобного или человекообразного, робота от «Сбера». О том, что Сбербанк разрабатывает подобных роботов, в начале декабря заявлял его зампред правления Станислав Кузнецов. Помимо указанной вакансии у «Сбера» есть еще несколько, связанных с поиском сотрудников в указанное направление. Например, специалисты в области промышленного дизайна, инженеры и др.
Она также отмечает, что кроме перемещения при создании таких роботов есть также задача научить их распознавать разные объекты и манипулирования ими, еще есть сложности с разработкой аккумуляторов, которые смогут питать роботов долгое время, а также материалов, которые могли бы облегчить конструкцию. По словам Конюховской, сейчас разработки антропоморфной робототехники активно ведутся в Китае, Японии и США, но прогресс совсем не быстрый. «Например, робот Atlas от Boston Dynamics был впервые анонсирован более десяти лет назад — в 2013-м, и только недавно они показали не очередной танец, а какое-то применение робота на заводе по перемещению объектов», — указала основательница RoboJobs, дополнив, что помимо применения таких роботов для заводов и бизнеса в Китае, например, есть планы по применению антропоморфных роботов для ухода за пожилыми. Ожидается, что такие проекты будут развиваться шире в 2027–2035 годах.
Воплощение собранности и спокойствия. У нее все под контролем и разложено по полочкам. Афина стремится сделать своего пользователя максимально продуктивным и эффективным, помогает структурировать дела. Любит артхаусное кино, читает и слушает мировую классику.
«Мы все разные. Кому-то нужен более энергичный помощник, кому-то — более собранный. Поэтому мы в Сбере разработали сразу трех персонажей, каждого со своими уникальными особенностями. Их главное отличие — внимание к пользователю. Ведь это то, что добавляет человечности в общение. Семейство Салют — это ассистенты, которые делают жизнь удобнее»
Салют — это не только название семьи ассистентов, но и слово для активации ассистента в устройствах. Это слово, которое легко произносить, оно быстро запоминается, это понятное международное приветствие. Слово не сильно распространено в ежедневном речевом обиходе россиян и не является частью часто употребляемых слов и выражений.
Руководитель Лаборатории инноваций «Норбит» (входит в группу «Ланит») Дмитрий Демидов пояснил, что главная особенность антропоморфных роботов заключается в том, что они схожи с человеком с точки зрения формы, размера и физических характеристик. «Можно сказать, что человек может делать все, и антропоморфный робот должен хотя бы частично повторять это за ним. Реализовать все это технически — действительно нетривиальная комплексная задача, даже имитацию движения и поддержание баланса, не говоря о продвинутых алгоритмах искусственного интеллекта для управления, принятия решений и быстрой адаптации к изменяющимся условиям», — добавил Демидов. По его версии, исходя из публично доступной информации, такой робот может стать продуктом «Сбера», встроенным в экосистему. «На него будет спрос. Главным фактором станет именно универсальность. Они смогут выполнять задачи в любом производстве и сфере услуг: стоять на конвейерной линии, закрывать транспортировочные задачи, заниматься сборкой и разборкой, контролем качества», — рассуждает Демидов. По словам гендиректора «PRO Роботов Груп» и основательницы RoboJobs Алисы Конюховской, разработка антропоморфного робота отличается высокой стоимостью и тем, что трудно обеспечить окупаемость. По ее словам, чаще всего роботов создают под узкоспециализированные функциональные задачи. «Например, перемещать объекты удобнее на колесной платформе, а не шагающей, поэтому для доставки применяют мобильных роботов на колесах. Антропоморфному роботу не просто не только что-то переносить, но и самому перемещаться, балансировать на ногах, колеса намного функциональнее для задач перемещения, но они не везде могут подходить под среду, ведь есть бордюры и лестницы. Вся среда обитания создается под человека, его форму тела и задачи, и чтобы выполнять эти задачи и функционировать в существующей среде, делают антропоморфных роботов», — рассказала Конюховская.
Блок понимания естественного языка (natural language understanding, NLU) использует современные нейросетевые модели на основе модифицированных многослойных трансформерных архитектур, в том числе с блоками разреженного внимания. Впервые в пользовательском решении при подготовке ответа на запрос человека использована генеративная нейросетевая модель, представляющая собой улучшенный вариант сети GPT-2. Это значит, что при общении с человеком нейронная сеть может не только выбрать заготовленную фразу из библиотеки, но и сложить новое предложение из слов или их фрагментов. Общаться с таким собеседником гораздо интереснее — он способен удивить.