Содержание статьи
Математики придумали задачу, которую искусственный интеллект не способен решить принципиально
Если говорить точнее, то и для Теоремы о неполноте, и для Гипотезы континуума, не существует ответа в привычном для машины виде. ИИ, даже самый продвинутый, при решении подобной задачи выйдет на такой шаг, когда не сможет дать оценку «верно» или «неверно». Человек бы просто махнул рукой, ввел бы некоторое дополнительное условие или проигнорировал важность выбора, принял решение интуитивно. Алгоритмы машинного обучения не позволяют такой вольности, поэтому ИИ не сможет продолжить работу.
Сегодня уже никого не удивить по-настоящему качественными изображениями, сгенерированными нейронными сетями. За последние пару лет разные компании опубликовали свои версии генеративных нейронных сетей на базе моделей DALL-E от OpenAI и Stable Diffusion. Многие слышали про компанию Midjourney, а также российские версии от Яндекса — Шедеврум и Сбербанка — Kandinsky. Мы начали исследования в этом направлении в далекие 2016-2017 годы, за шесть лет до появления первой версии DALL-E (первая версия появилась в 2021 году) и за семь лет до появления Stable Diffusion (выпущена в 2022 году). На тот момент основным инструментом создания таких моделей были генеративно-состязательные сети (GAN). Первым же коммерческим предложением наших моделей был проект 2018 года от одного российско-европейского издательства по созданию системы генерации обложек для книг на основании краткого содержания.
Иногда нам приходят запросы на решение совсем нереалистичных задач. Например, прогнозирование курсов популярных валют наподобие евро, доллара, фунта. Конечно, создание такой прогнозной системы невозможно — слишком много экономических, геополитических и других факторов влияют на курс.
В настоящей статье мы расскажем про самые удивительные, необычные проекты и запросы, которые поступали нам за последние годы. Некоторые из этих проектов не удалось реализовать, какие-то остановились на ранних стадиях разработки, а другие стали очень успешными.
В то же время в нашей истории уже были довольно успешные финансовые проекты, в частности создание системы оптимизации инвестиционного портфеля на основе алгоритмов машинного обучения (40 ценных бумаг / целевая волатильность 30% / ежедневная частота оптимизации баланса) и применение AI/ML к структуре сетевой корреляции для улучшения результатов оптимизации.
Международная группа исследователей систем машинного обучения и искусственного интеллекта пришла к неутешительному выводу – они более ограничены, чем мы полагали. Это проистекает из математической природы их архитектуры и методов работы. Согласно «Теореме о неполноте» Геделя и положениям его же Второй теоремы, в реальности далеко не все математические задачи решаемы. А так как машинное обучение имеет именно математическую природу, то у него есть свой предел.
Такие разработки требуют колоссальных вычислительных мощностей и ресурсов (нейронная сеть DALL-E начала разрабатываться в 2018 году, в 2019 году OpenAI получила грант в 1 млрд $ от компании Microsoft). Наши же разработки велись на базе собственных ресурсов, а также благодаря небольшой поддержке одного фонда в Нидерландах. В конце 2019 года началась пандемия Covid-19, и инвестиционный интерес со стороны фондов угас. Конкурировать с компаниями, имеющими практически неограниченные ресурсы, было сложно, поэтому мы постепенно заморозили это направление, хотя наши обложки продавались по всему миру. Спустя два года руководительница нашего отдела компьютерного зрения защитила диссертацию на тему генеративного ИИ в условиях ограниченных вычислительных ресурсов.
Одной из насущных проблем в машинном обучении является «оценка максимума». Ее можно проиллюстрировать на таком примере: есть некий сайт, который посетит неизвестное количество пользователей, чьи интересы заранее тоже неизвестны, но в целом набор параметров конечен. Нужно создать такой алгоритм, который обеспечит им всем показ целевой рекламы с точностью, близкой к абсолютной. При моделировании подобной ситуации ученые вышли на однозначное сходство с условиями «Гипотезы континуума», которая долго время находилась в списке нерешенных задач математики.
Бремя недоказуемости, увы, свойственно слишком многим математическим задачам, а потому вероятность того, что ИИ рано или поздно столкнется с похожей ситуацией, приближается к 100 %. Значит, нам нужно уже сегодня придумать, как позволить ему обойти подобные парадоксы. Но при этом сохранить ту точность анализа ситуации и принятия решений, ради которой мы и стараемся обучать наш рукотворный разум. А это тем сложнее, чем большее отклонение от правил допускается в его работе.
В течение последних восьми лет наша компания занимается разработкой решений на базе технологий искусственного интеллекта. Про многие из них мы рассказывали в прошлых статьях, посвященных системам компьютерного зрения, а также системам на базе больших языковых моделей и обработки естественных языков. Несмотря на то, что большинство наших решений направлено на решение довольно стандартных задач по оптимизации бизнес-процессов, мы всегда открыты к задачам, которые нередко имеют исследовательскую и научную составляющую.
Одним из первых таких проектов в далеком 2016 году стала задача предсказания характеристик пользователей: пол, возраст, уровень дохода и образования, психологические черты. Еще одной задачей стало прогнозирование поведения: рекомендации мест, людей, групп на основании данных аккаунтов из социальных сетей с различной модальностью контента (Twitter — тексты, Instagram (принадлежит корпорации Meta, деятельность которой признана в России экстремистской и запрещена) — изображения, Foursquare — геолокации), а также носимых устройств. Результаты таких предсказаний крайне полезны — например, для банков в рамках задачи пополнения данных о клиентах в целях более точного скоринга. В то время социальные сети были более открыты для возможности сбора и анализа данных, поэтому у нас были внушительные «датасеты». Проект показал крайне успешные результаты, но, к сожалению, на тот момент российские компании не были заинтересованы данным направлением, поэтому оно стало развиваться за пределами России, а позже в Сингапуре была создана отдельная компания, которая успешно развивается и в настоящее время.
Но криптовалюта, главным образом биткоин, — довольно спекулятивный актив. На его цену влияет и новостная повестка. В 2021 году стоимость биткоина выросла почти на 10% после того, как Илон Маск пообещал возобновить продажу машин Tesla за криптовалюту. Идея создания системы прогнозирования стоимости биткойна основана на анализе сотен крупнейших новостных агрегаторов, а также сообщений в Twitter (X) и других популярных социальных сетях на наличие событий и высказываний, которые потенциально могут влиять на курс. Современные подходы к решению этой задачи на базе больших языковых моделей позволяют довольно точно «отлавливать» такой новостной фон и делать успешные прогнозы.