Содержание статьи
Тест Тьюринга и возможности искусственного интеллекта
Вариации и альтернативы тесту Тьюринга
В 2018 году Google Duplex успешно записался по телефону в салон перед 7000 толпой. У администратора не возникло никаких подозрений, что ее собеседник вовсе не человек. Некоторые считают это прохождением теста Тьюринга, несмотря на то, что он не полагался на истинный формат теста.
В итоге, тест Тьюринга выявляет не наличие у программы функций человеческого мышления, а ее умение имитировать письменную или устную речь человека и поддерживать диалог. Поэтому нельзя утверждать, что сегодня тест Тьюринга проверяет способности ИИ в полной мере. Ведь современным компьютерам не составляет никакого труда совершать неподвластные большинству людей операции в самых разных областях знаний. Умение обмениваться сообщениями, имитируя человеческое общение, уже не рассматривается как признак высокого уровня ИИ.
В своей статье Тьюринг предложил вариант так называемой «Игры в имитацию». В нее играют трое: мужчина, женщина и исследователь, задающий вопросы, причем последний может быть любого пола. Каждый из них находится в отдельной комнате. Цель игры для исследователя — определить, кто мужчина, а кто женщина.
Смысл этой игры для вечеринок был в том, что C (эту роль также называют «судья») может только переписываться с A и B, стараясь при этом догадаться, кто из них мужчина, а кто женщина. Игрок A всеми силами старается обмануть судью, а B, напротив, должен давать подсказки и направлять догадки судьи в верное направление.
В чем заключается тест Тьюринга? Спустя семьдесят с лишним лет сложно понять, по каким параметрам автор предполагал выявлять разум компьютера. В целом, суть в следующем. Если человек, общаясь с искусственным интеллектом, сможет понять, что это вычислительная машина, она не прошла тест Тьюринга. Если же собеседник не догадается, что ведет диалог с ИИ, значит, искусственный разум справился с задачей.
В тесте Тьюринга один из участников заменяется компьютером. В первом варианте программа выступает в роли игрока А, цель которого – ввести судью в заблуждение, то есть выдать себя за реального человека, изобразив это лучше, чем человек B. В случае успеха A (компьютера) можно констатировать, что он обладает мышлением, то есть программа проходила тест Тьюринга.
Была также вторая конфигурация игры. В ней и компьютер, и второй игрок пытаются выдать себя за того, кем не являются, и обмануть C. Цель – выявить, кому удастся ввести в заблуждение судью — другому человеку или вычислительной машине (искусственному интеллекту).
Базируясь на второй версии игры, Тьюринг так отвечал на вопрос, в чем состоит суть теста. Он хотел проверить, способен ли компьютер с большим объемом памяти, а также высокой скоростью проведения операций и соответствующей программой заменить одного из игроков (A, женщину), тогда как вторым игроком (B) и судьей (C) будут люди.
Суть теста Тьюринга
Чем известен автор теста, названного в его честь? Алан Мэтисон Тьюринг (1912-1954 гг) специализировался на криптографии, информатике и математической логике. Кроме теста, одним из самых громких его изобретений считается проект машины Тьюринга (1936 год), на основе которой впоследствии разрабатывали современный компьютер. Также Алан Тьюринг смог найти шифр к сообщениям криптографической машины «Энигма», с помощью которой немцы во время войны передавали секретные данные.
Спустя 40 лет после разработки теста Тьюринга профессиональное сообщество предложило награждать премией Лебнера программистов, которым удалось создать продукт, обладающий свойствами, максимально отвечающими параметрам разумности. Победитель получал денежное вознаграждение. После 2020 года премия не назначается.
Но на деле оказалось, что пройти тест Тьюринга чаще удается роботам, которых научили хитрить. В частности, они допускали в переписке орфографические ошибки, отвечали неразвернуто или признавались в том, что не знают ответ на вопрос. Такие уловки помогали ввести людей в заблуждение, так как по четким ответам на все вопросы можно было бы легко распознать искусственный интеллект.
Для многих исследователей вопрос о том, способен ли компьютер пройти тест Тьюринга, стал неактуальным. Вместо того, чтобы думать, как убедить кого-то, что он разговаривает с человеком, а не с компьютерной программой, нужно сфокусироваться на том, как сделать взаимодействие человека и машины более интуитивным и эффективным. Например, с помощью диалогового интерфейса.
Данный тест относится к эмпирическим. Алан Тьюринг создал его, опираясь на данные, полученные из опытов. Описание его разработки было впервые напечатано в 1950 году в журнале Mind, посвященном философским вопросам. Статья британского математика называлась «Вычислительные машины и разум».
Важно, что в первом варианте тест считается пройденным машиной, если программа смогла ввести проверяющего в заблуждение. Во втором же варианте акцент делается на том, способен ли компьютер выдать себя за человека. Часто это различие остается вне фокуса внимания, и если человек был обманут программой, то ее рассматривают как ИИ, успешно прошедший тест Тьюринга.