Содержание статьи
Объединенный институт ядерных исследований
Ученые Лаборатории информационных технологий им. М. Г. Мещерякова ОИЯИ изучили методы на основе нейронной сети Хопфилда для трекинга (реконструкции траекторий) модельных событий эксперимента SPD, предложив оптимизацию параметров построения функции энергии нейросети. Оптимизация позволит улучшить результаты трекинга с учетом специфики эксперимента. Также исследователи рассмотрели вопрос применимости квантового отжига для решения задачи трекинга SPD.
Еще в 1980-х годах Б. Денби и К. Петерсон предложили использовать для трекинга нейросеть Хопфилда – полносвязную рекуррентную сеть бинарных нейронов с симметричной весовой матрицей. Нейроны в их сети соответствуют паре хитов, то есть сегменту возможного трека. Веса сети задаются так, чтобы обеспечивать гладкость траектории, то есть малость угла между смежными сегментами, награждая гладкие и не ветвящиеся треки. При эволюции активации нейронов к точке равновесия функция энергии сети Хопфилда сходится к минимуму, который соответствует хорошему результату трекинга. Использование метода симуляции отжига помогает искать глобальный минимум энергии сети. Несмотря на успех первых применений, интерес к использованию сетей Хопфилда для трекинга быстро угас из-за медленности их сходимости, их сверхчувствительности к шумовому фону и прежде всего из-за роста множественности событий, вызванного стремительным ростом светимости пучков частиц и развитием экспериментальных технологий. Тем не менее, в последнее время, благодаря развитию квантовых компьютеров и методов квантового отжига, позволившим радикально ускорить эволюцию сетей Хопфилда, интерес к нейросетевому трекингу Хопфилда резко возобновился.
«Мне кажется, что комитет решал какую-то странную политическую задачу. Искусственный интеллект (ИИ) ворвался в нашу жизнь и уже довольно сильно ее преобразил, и понятно желание многих организаций быть причастными к процессу. Но все же ИИ не подходит ни под одну из номинаций Нобелевского комитета, а вводить новые они не имеют права. Поэтому они по физике решили наградить людей, чьи достижения на самом деле лежат в области вычислительной математики, по которой, как известно, они не могут присуждать никаких премий», — заявил он.
Нобелевская премия по физике за 2024 году присуждена Джону Хопфилду из Принстонского университета и Джефри Хинтону из Университета Торонто за «основополагающие открытия и разработки, которые сделали возможным машинное обучение с искусственными нейронными сетями». В разговоре с RTVI специалист по нейросетям из ФИЦ «Информатика и управление» РАН Дмитрий Николаев выразил недоумение, почему премия по физике досталась специалистам по вычислительной математике.
В процессе работы динамика таких сетей сходится (конвергирует) к положению равновесия. Эти положения равновесия являются локальными минимумами функционала, называемого энергией сети. Примером использования нейронной сети Хопфилда является восстановление испорченного изображения.
«Хинтон, безусловно, классик ИИ. Но он далеко не единственный, поэтому хорошо бы понимать логику решения. Например, один из учеников Хинтона — Ян Лекун — известен как пионер применения сверточных сетей в распознавании изображений. И он не единственный “революционер” в ИИ. Насколько учитывается в Нобелевских премиях создание научной школы, я не знаю. В пресс-релизе эта часть абсолютно не освещена, есть только глухое упоминание того, что Хинтон “помог инициировать нынешнее взрывное развитие машинного обучения”. Помог, факт, — но, будем честны, вовсе не своей моделью Больцмановских машин, за которую присуждена премия. Хинтон — популяризатор метода обратного распространения ошибки, у него куча учеников, которые осуществляли прорыв за прорывом. Но все эти прорывы не были связаны с Больцмановскими машинами. Но! Зато Больцмановские машины — это как-бы-физика».
Одним из ключевых этапов обработки экспериментальных данных физики частиц является реконструкция траекторий элементарных частиц, когда для каждого события во взаимодействии частиц необходимо определить, какие хиты, т. е. точки, где был обнаружен пролет какой-либо частицы через детектор, были порождены одной и той же частицей. В планируемом на коллайдере NICA эксперименте SPD особую сложность вызовет чрезвычайно высокая частота взаимодействий (3 МГц), ведущая к перекрытию событий при их съеме в режиме временных промежутков — тайм-слайсов, а также сильное загрязнение данных ложными измерениями из-за особенностей устройства трековых детекторов SPD.
В настоящем исследовании проверялась применимость трекинга на основе сети Хопфилда к множеству событий, симулирующих те, что ожидаются в эксперименте SPD. Для получения хорошего результата потребовалась тонкая настройка весовых параметров и самой энергетической функции сети с помощью программных инструментов для оптимизации метапараметров.
«Кажется, это решение кроме как “физикой” объяснить вообще невозможно. Решили не давать одному человеку, во-первых, а во-вторых, дополнительно притянуть к физике. Таких моделей, как сеть Хопфилда, в машинном обучении известно штук десять, а может — двадцать. И большинство из них оказались тупиками, это не то, что “проросло” в диплернинге. Где сейчас сети Хопфилда используются в реальности, я понятия не имею».
Специалист по компьютерному зрению и нейронным сетям, завотделом «Зрительные системы» ФИЦ ИУ РАН и технический директор «Смарт Энджинс Сервис», д.т.н. Дмитрий Николаев заявил RTVI, что был шокирован, узнав, кому присудили премию по физике, и назвал это решение «иезуитским трюком».
«Конечно, это поклон не в сторону LGBTQ* и прочих таких букв, спасибо и на том. Но все же, как мне кажется, комитет сильно подпортил себе репутацию на ровном месте. Хинтон, Лекун и Бенджио уже получили премию Тьюринга в 2018 году, престижнейшую в компьютерных науках, и это было правильно. А что теперь думать физикам? Что больше физика вообще никому не нужна? Давайте доведем до логического конца и присудим создателям ChatGPT нобелевку по литературе».