Содержание статьи
Мы все умрём в войне нейросетей? Какие опасности таит в себе искусственный интеллект
© 2024 N + 1 Интернет-издание / Свидетельство о регистрации СМИ Эл № ФС77-67614
Сначала нейросеть выиграла пять матчей из пяти против TLO (Дарио Вунш, Германия), а затем другая версия нейросети победила пять раз подряд игрока MaNa (Гжегож Коминч, Польша). Оба профессионала входят в сотню сильнейших игроков в StarCraft II. Интересно, что средний APM (количество действий в минуту) нейросети оказался значительно меньше, чем у ее противников.
Самый простой, “архитипический” пример практического применения ИИ — одобрение заявки на кредит. Алгоритм изучает всю доступную о вас персональную информацию и принимает решение, являетесь ли вы дисциплинированным заёмщиком, который вернет деньги с процентами, или же вас следует отнести к дефолтному типу, т.е. вы представляете собой потенциальный риск для банка. Подобного рода задачи решаются сегодня практически во всех сферах бизнеса.
Опираясь на интеллектуальную инфраструктуру нейронной сети, GPT Advenure переписывает текст игры заново при каждом новом старте. Всё приключение выдумывается на ходу в зависимости от того, что вы напишете. Если указать текущее местоположение игрока и его действие — например, «иду на восток», — а после попросить GPT-2 предсказать, что будет дальше, то она расскажет о последствиях этого действия. Затем игрок совершает следующий шаг, и таким образом складывается полноценное приключение.
Программа AlphaStar, разработанная DeepMind, смогла обыграть двух профессиональных игроков в стратегию в реальном времени StarCraft II. Каждого из игроков-людей нейросеть победила в пяти матчах. Описание работы программы доступно на сайте DeepMind, а посмотреть на AlphaStar в деле можно на YouTube.
Недавно Илон Маск высказался в публичном поле, что, дескать, искусственный интеллект таит в себе такие угрозы, с которыми человечество пока даже не знает как быть. И предложил заморозить все разработки в этом направлении хотя бы на время, чтобы договориться о том, что делать с со всем этим дальше. О чём же тут идёт речь по сути? Свою точку зрения на проблему высказал Тимофей Решетов — русский философ и публицист, один из учредителей российского Фонда «Судьба Бытия».
Чтобы превратить GPT-2 в Мастера Подземелий, её создатель, Натан Уитмор, начал собирать записи пользователей, играющих в Zork и Colossal Cave Adventure. Эти текстовые приключенческие игры созданы в середине 1970-х годов для мэйнфрейма PDP-10. Компьютер был размером с холодильник и значительно уступал в мощности даже современным смартфонам, которые теперь помещаются в карман. Уитмор вдохновился Mind Game — вымышленной игрой, создаваемой искусственным интеллектом в научно-фантастическом романе Орсона Скотта Карда «Игра Эндера».
Яндекс обучил большую русскоязычную языковую модель YandexGPT и внедрил ее в своего виртуального помощника Алису. Сейчас нейросеть тестируют пользователи продуктов Яндекса, новость об этом вышла на сайте компании. Языковая модель — это нейросеть, которая умеет генерировать тексты, по очереди предсказывая каждое слово в предложении. Языковая модель YandexGPT основана на архитектуре Transformer, которую создали исследователи из Google в 2017 году. Когда в такую нейросеть загружают текст, она умеет выделять в нем важные слова и фокусировать на них внимание. Главный навык модели — хорошо понимать и запоминать тексты, и генерировать новые. Когда нейросеть осваивает этот навык, она одновременно естественным образом учится выполнять самые разные задачи, связанные с анализом текстов. Большие языковые модели основаны на архитектуре Transformer и обучены на огромном количестве данных, обычно из интернета. Они умеют создавать текст, почти не отличимый от человеческой речи. Первой успешной моделью такого типа стала нейросеть GPT от компании OpenAI. В 2022 вышла улучшенная версия модели ChatGPT. Ее не просто натренировали на большом количестве данных, но и дообучили с помощью обучения с подкреплением. Люди-эксперты работали с нейросетью в режиме диалога, показывая ей как правильно отвечать на вопросы. В надежде повторить успех ChatGPT, многие компании обучают свои языковые модели-аналоги (например, Bard от Google или Poe от Quora). Яндекс первым внедрил такую модель в виртуального помощника. 17 мая Яндекс выпустил большую языковую модель YandexGPT в открытый доступ. С ней можно пообщаться через Алису в приложении Яндекс, браузере, умной колонке или телевизоре. Чтобы активировать YandexGPT, нужно сказать: «Алиса, давай придумаем!» Языковая модель пока находится в режиме тестирования, но уже умеет выполнять разные задачи пользователей: выбрать подарок, составить план тренировки или написать деловое письмо. Модель умеет составлять грамотные содержательные тексты, но может ошибаться в фактах. Посмотрите, как пользователи общаются с YandexGPT: Нейросеть обучали на суперкомпьютерах Яндекса в два этапа. Сначала разработчики отобрали для обучения много книг, статей и страниц сайтов с помощью поисковых инструментов Яндекса — по утверждению компании, в выборку попадали только содержательные и хорошо написанные тексты. На втором этапе модель дообучили, чтобы она лучше вела диалог. Для этого Яндекс воспользовался методом, который придумали исследователи из OpenAI. Эксперты-разметчики составили сотни тысяч пар вопрос-ответ и показывали их YandexGPT на втором этапе обучения. Но у YandexGPT есть свои ограничения. Например, нейросеть пока не умеет запоминать контекст и учитывать предыдущие реплики. Однако YandexGPT постоянно дообучается на новых данных от пользователей и может развить этот навык в будущем. Cравнить качество ответов YandexGPT с другими языковыми моделями пока невозможно, Яндекс не раскрыл эти данные. Также неизвестна точная архитектура модели и параметры ее обучения. Тем временем другая языковая модель GPT-4 научилась работать не только с текстом, но и с картинками.
Для справки хочу заметить, что GPT = Generative Pre-trained Transformer, что можно перевести как “генерирующий предварительно обученный преобразователь”. Это алгоритм, математическая модель, которая после соответствующего обучения способна генерировать (производить) поток текстовой информации методом трансформации текста, изначально заложенного в его [алгоритма] обучение. Либо генерировать новые картинки на основе просмотренных ранее.
Что такое искусственный интеллект
Итак, мы уже окружены ИИ со всех сторон. И процесс внедрения машинных алгоритмов в нашу повседневность идет опережающими темпами. Это, безусловно, настораживает. Если сегодня автомобили, смартфоны и даже пылесосы могут выполнять ваши голосовые команды и решать ваши задачи без вашего непосредственного участия, что же будет завтра? Очевидно, что цифровизация влияет на весь наш социум и идея о том, что дальнейшее развитие данного процесса несёт в себе определённые риски, весьма актуальна.
Мы уже писали о нейросети GPT-2, которая умеет генерировать реалистичный текст. Вы можете дать ей начало предложения, и она попытается закончить его. Создатели нейросети сочли слишком рискованным выкладывать полную версию алгоритма в открытый доступ, но это не остановило энтузиаста Натана Уитмора — на основе GPT-2 он разработал текстовую приключенческую игру GPT Adventure.
Такое поведение отчасти является творческим, хотя нейросети на самом деле не придумывают новые истории или идеи, а просто используют отрывки из существующих произведений. Но понятие творчества трактуется по-разному, поэтому создание связного игрового сюжета вполне можно отнести к проявлению креатива.
Искусственный интеллект (англ. Artificial intelligence, AI) — это всего лишь программный код, который призван выполнять определённые практические задачи. Этот код ещё называется нейросетью (англ. Neural Network, NN). Причём код этот не очень сложный в плане программирования, но он требует а) мощнейших вычислительных ресурсов (и, соответственно, энергозатрат) и б) огромных массивов данных, которые называют Большими данными (Big Data).
В своей лекции Андрей использует любопытную аналогию, он говорит, что нейросеть “фантазирует” (dream) текст. На мой взгляд, это очень удачное определение результатов работы любой нейронной сети вообще: они ничего не сочиняют, потому что как раз сочинять они не могут. Они просто имитируют те тексты, на которых они были обучены, ничего более. Ни о каком творческом процессе речь тут не идет. В этом контексте он говорит о том, что нейросети часто “галлюцинируют”. Это значит, что на выходе они выдают текст, который статистически по форме выглядит совершенно корректно, но в содержательном плане не имеет никакого смысла. Подобного рода галлюцинации вполне естественны и в процессе обучения задача как раз состоит в том, чтобы довести процесс фантазирования до такого уровня, когда галлюцинации перестают выбиваться из контекста и начинают вписываться в рамки человеческого разумения.
Первая часть StarCraft тоже представляет собой сложную задачу даже для методов глубокого обучения. Так, в октябре 2017 года своего бота для этой игры представила компания Facebook, и он оказался слабее программ, созданных программистами-любителями. Специалистам из Alibaba Group и Университетского колледжа Лондона удалось научить свою программу неплохому уровню микроконтроля юнитов при ведении боя, но на полноценную игру их разработка все еще не способна.
Бездушный алгоритм или творчество?
Получившаяся игра во многом напоминает старые текстовые приключенческие игры с теми же базовыми элементами и механикой. Уитмор признаёт, что для этого ему пришлось добавить несколько дополнительных настроек. «GPT-2 иногда допускает ошибки, например, забывает, где находится игрок», — говорит автор. «Мой код сводит число ошибок к минимуму и делает игру более стабильной».
И, между тем, если бы наше общество было устроено на принципах взаимного доверия, если бы государственные институты стремились нести благо людям, подобного рода «цифровизация» могла бы показаться не просто допустимой, но даже желательной. Разве плохо, когда компьютер распознаёт преступника, вычисляет мошенника, до того, как они успеют причинить вред? Разве плохо, если алгоритм диагностирует резкое ухудшение состояния здоровья до того, как случится инсульт или инфаркт, и позволяет обойтись профилактическими методами, спасти жизнь?
Однако вполне реально, что если такой мощный инструмент попадает в руки маньяка, одержимого идеями собственного превосходства, то исход таких событий сложно предсказать. Например, представим себе, что некий разработчик, обладающий достаточными вычислительными ресурсами, обучает свою нейросеть на генетических данных нескольких миллионов человек, животных, птиц, рыб, растений. Допустим, такая сеть оперирует несколькими триллионами параметров и на её обучение требуется потратить годы работы нескольких современных датацентров, сжечь гигаваты электроэнергии. Однако, в итоге у хозяина/заказчика всего этого дела появляется возможность генерировать любой код РНК/ДНК, в том числе — код вируса, который, попадая в биологический организм с заданными параметрами вызывает в нём контролируемую необратимую генетическую мутацию. И параллельно с этим вирусом разрабатывается некая “вакцина” — которая гарантировано нивелирует воздействие вируса на тот же самый организм.
Не буду пересказывать содержания всего выступления. Основная его часть посвящена вопросу эволюционирования больших языковых моделей и тем задачам, которые они сегодня способны решать и смогут решать в будущем. В частности, речь идет о том, чтобы от примитивной имитации человеческой речи, т.е. от предсказания последовательности слов, чем языковые нейросети по сути занимается сейчас, перейти к принципиально новым уровням организации алгоритма. Будущие нейросети должны научиться “мыслить логически” и самосовершенствоваться. Именно эти задачи стоят сегодня на повестке дня разработчиков.
Больше всего многих пугает вероятность вытеснения людей из сферы производственной деятельности, т.е. потеря рабочих мест, а, стало быть, заработка, финансовой стабильности. На мой взгляд подобная угроза, хотя она безусловно реальна, — не самое страшное, что нас ожидает.
GPT Adventure — неплохая игра, хотя иногда её сюжет развивается очень странным образом. Когда люди пытаются использовать ИИ для создания текстов, ошибки и странности в генерации сюжетной линии происходят постоянно: взять хотя бы сгенерированный нейросетью монолог JD из “Scrubs” или новые главы «Игры Престолов». Если вы когда-либо запускали текстовые игры, то можете заметить, что в GPT Adventure используются и порой странным образом смешиваются некоторые их идеи и концепции.
Необходимо сформировать такую среду обитания, в которой противостояние и превосходство просто не будет иметь смысла; в которой сотрудничество ради достижения общих глобальных целей сделается основной нормой совместного планетарного бытия. В такой среде искусственный интеллект займет подобающее ему место и станет реальным подспорьем эволюционного прогресса планетарной цивилизации.
Стоит отметить что все же небольшое преимущество у AlphaStar было — несмотря на то, что туман войны закрывал карту для нейросети так же, как и для человека, программа получала для обработки не частичное изображение известной области (условный экран), а видела сразу все, что позволяет увидеть игра. Благодаря этому нейросети не приходилось постоянно переключаться между разными зонами карты для контроля за происходящим. Когда же для еще одного демонстрационного матча с MaNa разработчики заставили AlphaStar играть с обычным ограничением масштаба видимой области, то нейросеть проиграла человеку. Правда, в DeepMind отмечают, что самостоятельно двигающая камеру версия программы обучалась в «лиге AlphaStar» всего семь дней.