Содержание статьи
Что не используется искусственным интеллектом при решении задач
Сформулировать задачу и разложить ее на составляющие
— Да. Искусственный интеллект, с одной стороны, позволил нам не только применять больше разных методов, но и иметь больше возможностей по исследованию альтернативных источников данных. То есть если раньше исследователи в основном базировались на официальной статистике, то технологии искусственного интеллекта позволили нам собирать информацию из других источников. Причем эти источники не являются собранными и агрегированными в каком-то виде, мы сами можем их собирать и агрегировать.
Потеря точности
После обучения модели на исторических данных, любые изменения на входе могут резко снизить ее точность. Например, модели, обученные до пандемии COVID-19, стали плохо справляться с предсказаниями в изменившихся социальных условиях — потребовалось полное переобучение, что опять-таки дорого и сложно.
С другой стороны, мы можем говорить и о новшествах при обработке этого огромного количества разных данных. Появляются механизмы, которые позволяют не только переработать текстовую информацию в количественную, но и найти какие-то взаимосвязи между этими данными. Это, конечно же, можно делать и в эконометрическом исследовании, но здесь используются другие подходы, которые в каком-то смысле более гибкие, потому что мы можем не создавать какие-то жесткие формы взаимосвязи, как в эконометрике, а пытаться получить эту форму из данных.
— Конечно же, есть вызовы, которые нас немного сдерживают в применении этих методов. Почему, например, мы хотим параллельно использовать альтернативные методы исследований? Потому что те же нейросети — это черный ящик для нас. Часто исследователи используют уже готовые алгоритмы, мы не всегда понимаем, как они работают и насколько достоверный дают результат. Это очень хорошо прослеживается на текущих примерах чатов вроде ChatGPT, GigaChat Сбера или Yandex GPT: когда мы делаем какие-то запросы в них, информация, которая выдается, часто может быть неправдоподобной — в зависимости от словарей, на которых нейросеть обучается. Программисты называют это рисками галлюцинаций. Наша задача в том числе — уметь различить, где искусственный интеллект нагло врет, а где говорит правду.
Часто имеющаяся статистика дается исследователям с большим лагом — от полугода и более. И наша работа как раз заключалась в том, что с помощью методов NLP-моделей (алгоритмы искусственного интеллекта, предназначенные для анализа, понимания и генерации человеческого языка. — Ред.) мы собирали облако ключевых запросов, которые отражают тематики, связанные с миграционным поведением. С другой стороны, используя выбранные ключевые параметры, мы строили эконометрические модели, с помощью которых сначала анализировали связь между ними, а потом уже строили прогнозы. Здесь также используются нейросети, в том числе для обнаружения взаимосвязи между миграцией и поисковыми запросами.
В различных индустриях: здравоохранении, промышленности, дискретном производстве, нефтегазовом секторе и транспорте имеются десятки проектов, направленных на внедрение искусственного интеллекта, — предприятия в этих отраслях стремятся использовать возможности ИИ для решения своих насущных задач. Достигнута критическая масса, когда искусственный интеллект в целом и машинное обучение в частности стали интересны и востребованы всеми, что серьезно влияет на развитие технологий и бизнес-процессов.
В промышленности внедрение технологий ИИ также приобретает все больший размах, например при прогнозировании выхода из строя оборудования — оптимизация расходов на газонасосное оборудование может крупной нефтяной компании сэкономить миллиарды рублей в год, а также предотвратит техногенные катастрофы.
С другой стороны, очень важный навык — это уметь сформулировать задачу и разложить ее на составляющие. Мы уже говорили об этом. Чтобы сформулировать задачу, нужно ее понять и передать вашему помощнику так, чтобы он тоже понял, что вы от него хотите. Это очень важная задача. Она в принципе нужна по жизни.
Студенты в GPT и риски галлюцинаций
Схожая ситуация наблюдается и с методами машинного обучения, когда возникает задача по неструктурированным данным распознать паттерны поведения выборки и научиться прогнозировать. Статистические и математические методы в этом случае не применимы — как правило, не существует линейных функций и четких корреляционных зависимостей, а область исследования предполагает учет множества параметров.
«Кремниевая лихорадка» XXI века
Вместе с тем пессимисты отмечают, что общество находится в разгаре очередной «кремниевой лихорадки», напоминающей «золотые лихорадки» XIX века — люди массово отправлялись на поиски золота, активно закупая различные инструменты: сапоги, лопаты, промывочные лотки, оружие и пр. В конечном итоге именно продавцы всего подобного оборудования гарантированно выиграли от лихорадки, а искатели в своем большинстве потерпели сокрушительную неудачу.
С появлением нейросетей искусственный интеллект стал неотъемлемой частью нашей жизни, в том числе профессиональной. У исследователей появилось больше данных и больше возможностей их изучать, передав часть рутинных функций искусственному интеллекту. О том, как ИИ и машинное обучение повлияли на экономические исследования и студентов-экономистов, рассказала профессор департамента прикладной экономики ФЭН НИУ ВШЭ, академический руководитель образовательной программы «Экономический анализ» Елена Вакуленко.
Может быть, это не за горами — эта опция появится, и искусственный интеллект лучше будет отслеживать такие вещи. Но пока мы, исследователи, имеем некоторые преимущества в этом плане перед искусственным интеллектом. Мы можем в своей экспертизе отлавливать нестандартные ситуации, применять разные подходы, разные алгоритмы.
Ситуация с искусственным интеллектом напоминает ту же лихорадку. Например, ChatGPT требует огромных инвестиций в вычислительные ресурсы, оборудование и электроэнергию. Ажиотаж вокруг этого чат-бота вызвал рост акций технологических компаний, постоянно привлекающих новые инвестиции, что, в свою очередь, способствует росту акций и финансированию новых стартапов и исследований. Такая активность создает «хайп» вокруг ИИ, что еще больше стимулирует рост рынка. Например, стоимость акций компании Nvidia за один день увеличилась на 250 млрд долл., и недавно ее генеральный директор заявил, что уже через пять лет будет создан сильный искусственный интеллект, способный сдать любой экзамен не хуже человека. Это громкое утверждение имеет вполне конкретную цель — повысить стоимость акций ведущего поставщика оборудования для поддержки алгоритмов машинного обучения — конечно, для индустрии искусственного интеллекта потребуется еще больше чипов.
Нейросети — это всего лишь аппроксимация графиков
Задачи классификации и распознавания объектов действительно хорошо решаются с помощью нейронных сетей. Особенно стоит отметить успехи ChatGPT и мультимодальных нейронных сетей в генерации контента, идентичного натуральному, здесь даже скептики должны согласиться. Однако, как известно, работа нейросети сводится к аппроксимации графиков функций — удивляет, что такой простой математический аппарат, как аппроксимация графиков, удалось применить к решению большого числа проблем, в том числе и к прогнозированию. Тот факт, что стала возможной генерация контента, включая фото и видео, поражает.