Содержание статьи
В России готовится платформа искусственного интеллекта для управления государством
Доступ к данным для обучения ИИ
Эффект от внедрения искусственного интеллекта наиболее высокий в индустриях, где есть большое число задач, связанных с работой с данными: страхование, телекоммуникации, ИТ и банкинг. В абсолютном выражении около 70% потенциала приходится на шесть ключевых для российской экономики отраслей: транспорт и логистика, банкинг, ритейл, добывающая промышленность, производство потребительских товаров, ИТ-отрасль, говорится в исследовании.
В 2023 г. объем российского рынка ИИ составил 650 млрд руб. — это почти на 18% больше, чем в 2022 г. Более тысячи компаний занимаются разработками и более 90 центров — исследованиями в сфере искусственного интеллекта. По словам вице-премьера России Дмитрия Чернышенко, к 2030 г. благодаря внедрению ИИ выручка топ-100 российских ИТ-компаний увеличится в 2,5 раза до 5,3 трлн руб., а ВВП вырастет на 11,2 трлн руб.
«Стимулируя работы по фундаментальным технологиям (химия, микроэлектроника, новые технологические и алгоритмические решения), мы создадим питательную почву, на которой бизнес сам заполнит все предоставленное законом пространство», — в свою очередь, считает Владислав Николаев.
«Технология ИИ меняет экономику так быстро и радикально, как вся цифровая революция за предыдущие 30-50 лет. Экспертные оценки российского рынка расходятся на порядок. Но точно можно сказать, что динамика российского рынка повторяет динамику мировой отрасли, правда, с небольшим запозданием. Через 1-2 года мы должны достичь сходных цифр», — уверен Владислав Николаев, коммерческий директор компании «ХайТэк».
По словам главы Министерства цифрового развития, связи и массовых коммуникаций РФ (Минцифры) Максута Шадаева, приоритетными направлениями внедрения ИИ-решений в системе госуправления должны стать упрощение получения государственных услуг, повышение эффективности планирования территориального развития, упрощение медицинской диагностики, решение множества задач путем анализа спутниковых снимков, повышение качества прогнозов погоды.
Об отсутствии необходимых для обучения моделей данных говорит и Александр Каушанский. Например, создание больших языковых моделей предполагает наличие дата-сетов, которые представляют собой наборы данных из различных источников для реализации модели знаний на национальных языках. Сейчас в распространяемых мультиязыковых моделях-лидерах доля русского языка составляет 0,3-0,5%, в то время как доля английского языка — порядка 90%. Модель Falcon Института технологических инноваций ОАЭ вообще не поддерживает русский язык. «Нам просто необходимы создание, поддержка и развитие цензурированного суверенного дата-сета на русском языке и языках народов РФ с целью полноценного и конкурентного развития разработок, основанных на технологиях больших языковых моделей», — говорит эксперт.
При этом основные направления внедрения ИИ — это клиентский сервис (55% среди опрошенных компаний, преимущественно в В2С-индустриях — банкинге, розничной торговле, электронной коммерции), маркетинг и продажи (52% — в основном в В2С), производство (46% — главным образом «тяжелые» индустрии — металлы и горная добыча, нефть и газ, автомобильная промышленность). «Именно в этих направлениях уже сейчас есть работающие решения, доказавшие свою эффективность для бизнеса, — чат-боты и интеллектуальные ассистенты в клиентской поддержке, рекомендательные технологии в маркетинге, предиктивная аналитика на производстве», — указывают аналитики.
В октябре 2019 г. указом президента РФ Владимира Путина была утверждена Национальная стратегия развития искусственного интеллекта на период до 2030 г. В национальную программу «Цифровая экономика» был добавлен федеральный проект «Искусственный интеллект», его активная реализация началась в 2021 г.
Выбор подрядчика
В конце декабря 2023 г. были обнародованы результаты исследования «Индекс интеллектуальной зрелости». В ходе исследования были опрошены региональные органы исполнительной власти (РОИВ) 89 субъектов РФ, органы местного самоуправления и организации из 20 пилотных субъектов России. Оценка производилась по 11 группам показателей, в числе которых использование искусственного интеллекта, эффекты от его применения, инфраструктура и данные, необходимые для использования ИИ, кадры и компетенции в сфере ИИ.
«Иностранные инвесторы вкладывают большие деньги в дорогостоящую разработку больших лингвистических моделей для обработки естественного языка (Large Language Model — LLM). Основываясь на мнении отраслевых экспертов, разработка семейства моделей GPT обошлась OpenAI в несколько сотен миллионов долларов. При этом на сегодняшний день компания несет колоссальные убытки, существуя только за счет денег, полученных извне. В тоже время на российском рынке есть две крупные LLM: YandexGPT и GigaChat — обе были разработаны компаниями, уже не нуждающимися в таком объеме инвестиций для обеспечения достаточной вычислительной мощности», — рассказывает Владислав Ботнев.
Еще одна проблема — неоднородность данных информационных систем. «Единый информационный ландшафт с общими базами данных и потоками у коммерческих компаний отсутствует, так что работникам приходится собирать и структурировать большой объем сведений из различных источников», — говорит Александр Каушанский.
В 2023 г. количество тендеров на закупку решений на базе ИИ государственными ведомствами и организациями увеличилось в 2,5 раза. Если в 2022 г. на площадке было проведено 97 конкурсных процедур на общую сумму 256,1 млн руб., то в 2023 г. — уже 239 на общую сумму 1,5 млрд руб.
Директор по стратегическим проектам Института исследований интернета Ирина Левова считает, что для работы ИИ-госплатформы государственных данных для обучения моделей не будет достаточно: «Для развития системы необходимо заинтересовать в обеспечении качества данных и государство, и крупные компании».
Немаловажная проблема — сомнения в надежности и безопасности технологии. Что будет, если искусственный интеллект ошибется? Кто будет нести ответственность за последствия ошибок? Кроме того, по мнению Дмитрия Демидова, в этой сфере не уделяется должного внимания кибербезопасности. «В ближайшем будущем вопрос встанет острее», — уверен он.
На базе платформы «Гостех» создается платформа по искусственному интеллекту, с помощью которой государственные организации смогут обрабатывать данные и создавать на их основе ИИ-сервисы. Также планируется организовать обучение государственных служащих использованию этой технологии.
Вторая причина — это структура финансирования. «Как все это работает, условно говоря, на Западе? Стартап с идеей набирает инвестиции на ее реализацию. Затем, как в случае с OpenAI, у него образуется один или несколько основных инвесторов, но независимость вполне может сохраняться. У нас же главным инвестором является государство или окологосударственные структуры вроде «Сбера», что накладывает определенные ограничения — бюрократические, организационные или технологические, и это все тормозит развитие. Если в экономическом плане подобный подход может себя оправдывать, то с инновационной точки зрения он далеко не оптимален», — уверен Каушанский.