Содержание статьи
За пять-десять лет нейросети вполне могут научиться нас обыгрывать»
Сверхчеловеческие способности не для го
В прошлом году во время празднования Дня города москвичей и гостей столицы возил по Тверской небольшой шестиместный автобус под названием MatrЁshka — полностью беспилотное средство, которое изначально таким и проектировалось: руля в нем не было вообще. На MatrЁshka использовалась разработанная в компании “Визиллект Сервис” система визуальной навигации LiNE, определяющая положение беспилотника и параметры его движения по видеоизображениям.
Теперь сеть может на экране монитора превратить летний пейзаж в зимний, апельсин — в яблоко (с такими же впадинками и пятнышками), кошку — в собаку, зебру — в лошадь. “Чтобы решать многие задачи, которые относятся к функциональному интеллекту, необходимо воображение, именно поэтому человек мог их решить, а машина — нет, — говорит Ю.Визильтер. — Когда были изобретены генеративные состязательные сети, у машин появился некий аналог воображения, и это стало ключом к решению очень многих задач”.
В сложных настольных играх даже огромная скорость вычислений суперкомпьютеров сама по себе не могла гарантировать победу. Уверенно громить людей в нардах и го программы смогли только после того, как нейронные сети позволили им обрести аналог человеческой интуиции. А началось всё с нейросети, которая показала людям, как надо играть в нарды.
ИТ: До нас нейросеть «выучила язык» на миллионах текстов и умеет просто продолжать текст на русском, а мы говорим ей «окей, твоя задача — генерировать текст исключительно в стиле вопросов ЧГК». Для этого хватает меньше примеров, чем для обучения, хотя тут большое количество данных тоже не помешает. Например, «нейроавтора» (одна из рубрик в канале, когда модель обучается на вопросах одного автора, — прим. ред.) я обучаю, семь раз показав модели некоторое количество вопросов, которое может быть не больше 150, а всю базу достаточно показать от одного до трех раз.
— Один из самых крупных наших проектов — автоматический классификатор транспортных средств. Эта система сейчас стоит на всех платных дорогах страны, она распознает класс транспортного средства по количеству колес и высоте машины. Основное отличие наших разработок от большинства тех, которые демонстрируются на конференциях, в том, что они работают на улице в любых погодных условиях (в снег, дождь, туман) с высоким качеством классификации — 99,7%.
Один из ведущих специалистов в области создания AI — Юрий ВИЗИЛЬТЕР, начальник подразделения ГосНИИ авиационных систем (ГосНИИАС), профессор РАН и заместитель созданного указом Президента РФ Экспертного совета национального центра развития технологии и базовых элементов робототехники — настроен оптимистически. Он уверен, что буквально через пару лет будут практически решены все научные задачи, необходимые для создания функционального искусственного интеллекта, то есть устройства, выполняющего функции, на которые, как считалось раньше, способен только человек.
Н есмотря на это, в конце 2017-го и в 2018-м прорывы в сфере ИИ, по словам Ю.Визильтера, “пошли фонтаном”. Нельзя сказать, что все проблемы решены, но “были перекинуты все необходимые мосты через существующие пропасти”, то есть пробелы в знаниях и технологиях. Перечисление этих “прорывов” звучало как музыка — красиво и непонятно: глубокие соревнующиеся сети для имитации данных, интерпретация динамической визуальной информации на естественном языке, обучение нейронных сетей с помощью активных агентов, где активные агенты — это база искусственного интеллекта первого типа. Наконец, ученые вплотную подошли к автоматическому конструированию обучения нейронных сетей.
Проблема состояла в запредельной сложности игры, которую были неспособны просчитать компьютеры, работающие по классическим принципам шахматных программ. Наглядно проиллюстрировать сложность го относительно других настолок позволяет размер дерева игры, который можно оценить с помощью несложной формулы:
AlphaGo: цифровая интуиция в действии
Конечно, с момента появления TD-Gammon наука ушла далеко вперёд. Поэтому в распоряжении Deep Mind были более продвинутые технологии , чем у Джеральда Тезауро в 1995 году. В AlphaGo применили две очень сложные по своему внутреннему устройству нейросети и намного более совершенные методы их обучения (глубокое обучение). Но общие идеи построения программ были очень похожи.
В прошлом году компания Илона Маска Open AI создали очень мощную нейросеть GPT-3. Она оказалась настолько крута, что, по словам разработчиков, «мир к ней не готов». Её не стали выкладывать в открытый доступ, и работать с ней можно только через API по подписке за деньги.
Последующий компьютерный анализ (метод, называемый Rollout) показал, что решение нейросети с большей вероятностью ведёт к улучшению игровой ситуации. Вдохновившись манерой игры TD-Gammon, профессионалы начали экспериментировать с первым ходом по примеру умной программы и добились успеха. Через несколько лет популярный ранее слоттинг практически исчез из дебютов турнирных игр. Так нейросеть способствовала изменению игры в нарды.
— Но как только глубокие сети начнут обыгрывать человека в стратегические игры, а это — дело времени, в мире наступит неустойчивое равновесие, заметил он. — Представьте себе, что у России есть компьютер, который играет в военную игру. И у США есть. И у Китая. И еще у какой-то страны с ракетами. Тот момент, когда какой-то стране станет известно, что у нее компьютер лучше, будет для нее лучшим моментом для нападения. Это очень сильно дестабилизирующий фактор в мировой политике!
Программа TD-Gammon оказала влияние на сообщество экспертов по нардам. Стиль её игры сильно отличался от традиционных стратегий — и во многих случаях оказывался эффективнее. Это привело к значительным изменениям в позиционном мышлении профессиональных игроков.
АИ: ыыыыы, может, это всё же нейросеть, а не просто редактор, который только редактировал и выдавал готовые ответы? 🙂 Но если всё же нейросеть, то она будет генерить те вопросы, которые сами собой не возникнут. Хотя если у вас не нейросеть, а программа — тоже, то почему нет?:) А может, всё наоборот и она уже давно есть?:) А может, и нет вообще:). 🙂 Хотя нет, не может, если я правильно понял вопрос.
Небольшая дискуссия на тему “быть зиме или не быть” все же вспыхнула. Анатолий Козырев, заместитель директора ЦЭМИ РАН и главный редактор журнала “Цифровая экономика”, признаки наступающего “охлаждения” видит в оттоке инвестиций из исследований искусственного интеллекта. Коллеги с ним не то чтобы спорили, но возразили, что AI в любом случае будет развиваться и приносить добавочную стоимость. А что там будет, зима или лето, неважно. Зимой ведь тоже что-то развивается! “И в снежки можно играть”, — пошутил кто-то.
Однако этот подход не позволяет программам достойно играть в го из-за огромной сложности игры. Если мы посмотрим на таблицу, то увидим, что размер дерева для го на 80 порядков превосходит аналогичный параметр дерева для шахмат, что больше числа атомов во Вселенной. Просчитать такое количество вариантов не способен ни один суперкомпьютер в мире.
«Если я буду думать, что люди не смогут написать вопросы, я не найду в этом ничего хорошего»
СД: Нейросеть, которая уже предварительно обучена и умеет генерировать просто какие-то предложения на человеческом языке, можно дообучить с меньшими ресурсами для выполнения определенной задачи — например, генерировать вопросы интеллектуальных игр.
СД: Далеко не всегда, но все же. Это сильно зависит от источника, конечно. Если это условный пост на Яндекс.Дзене, в стиле «интересный факт о чем-то, который вы не знали», она легко сможет понять, в чем, собственно, факт. Если в источнике в принципе ничего интересного нет, то она все равно будет пытаться что-то родить.
Чтобы научить нейронные сети, нужны сверхбольшие массивы данных. А что, если их не хватает? Например, при отладке системы беспилотного автомобиля можно ли сделать так, чтобы сеть, которая обучалась на летних данных, могла бы переобучиться работать зимой? Оказывается, можно. “Делаются две глубокие сети. Одна из них называется генератор, другая — дискриминатор. Генератор старается создавать визуальные образы из нового домена. Дискриминатор пытается его разоблачить. Если генератор создал картинку, которая обманула дискриминатор, то он “поощряется”, а дискриминатор “наказывается”, потому что не распознал, плохо сделал свою работу. И наоборот: если дискриминатор разоблачил, что это именно сгенерированный образ, а не тот, который из настоящей выборки, то он “поощряется”. Так они друг друга тренируют”, — объяснил докладчик.
ИТ: Одна из моих моделей неплохо умеет играть в свояк — чисто на своих внутренних весах, без интернета! Когда дойдут руки, обучу её играть и в ЧГК. Серёжа тоже хотел научить нынешнюю модель брать вопросики. У меня есть примерная дата в уме — день программиста, 13 сентября. Хочется сделать прямо серьёзный турнир, заказать 30 вопросов, подложить 6 нейровопросов и дать командам сыграть это параллельно с компьютером. Получилось сделать «Вокруг АЛЬФЫ» (турнир на вопросах нейросети, — прим. ред.) — вывезем и это.
Например, TD-Gammon научилась разыгрывать определённые начальные позиции не так, как было принято среди экспертов. Когда при первом броске на костях выпадало сочетание 2–1, 4–1 или 5–1, профессиональные игроки до появления TD-Gammon практически всегда совершали типовой ход: они перемещали фишку с 6‑го пункта на 5‑й. Такой элемент игры называется « слоттинг ». Однако нейросеть в той же ситуации предпочитала делать неожиданный манёвр: она сдвигала фишку с 24-го на 23-й пункт. Такой элемент игры противоположен предыдущему и называется « сплитирование ».
Сейчас, считает Ю.Визильтер, практически все задачи компьютерного зрения решаются лучше, чем старыми методами. Например, сеть научилась автоматически переводить изображение в карту. В 2016 году была технически решена задача обнаружения объектов по классам в реальном времени.