Содержание статьи
Как Цукерберг создал Джарвиса из «Железного человека» перевод
ВАЛЛ-И
Распознавание лиц — особенно сложная версия распознавания объектов, потому что большинство людей выглядят относительно похоже (компьютеру легче отличить друг от друга два произвольных объекта, например, сэндвич и дом). Но Facebook очень хорош в распознавании лиц, чтобы отмечать друзей в ваших фотографиях. Та же самая технология подходит для того, чтобы ИИ мог определить, кто из ваших друзей стоит у дверей вашего дома.
Кто не знаком с «Джарвисом» из киновселенной Marvel? J.A.R.V.I.S (Just A Rather Very Intelligent System, «просто очень интеллектуальная система») — это программа, которая помогает знаменитому изобретателю Тони Старку как в быту, так и во время сражений. Свое имя «умный помощник» получил в честь дворецкого Эдвина Джарвиса, который был надежным компаньоном отца Тони Старка. От фильма к фильму ИИ получает все новые возможности: поначалу он служит вроде персонального ассистента, затем управляет костюмами железного человека, а в одном из эпизодов получает немаловажную роль в деле спасения всего человечества — как это принято у Marvel. При этом сам «железный человек» Тони Старк относится к Джарвису не просто как к программе — ИИ воспринимается как верный товарищ изобретателя.
Другое интересное ограничение в системах распознования речи — и машинного обучения в целом — это то, что они оптимизированы для специфических проблем. Например, понимать разговор человека с компьютером — не совсем то же самое, что понимать разговор человека с другим человеком. Если вы учите машину, предоставляя ей данные из поисковых запросов Google, когда люди разговаривают со строкой поиска, то эта машина будет работать хуже на сайте Facebook, где люди разговаривают друг с другом.
Для этого, я просто установил несколько камер на моей двери, которые захватывают картинку с разных углов. Сегодняшние ИИ пока еще не умеют идентифицировать людей по их макушкам, потому наличие нескольких углов гарантирует, что компьютер получит изображение лица. Я построил простой сервер, которые постоянно мониторит обе камеры и выполняет двухступенчатый процесс: во-первых, он запускает процесс выявления лиц (который позволяет определить, что к двери подошел человек), во-вторых, если он находит лицо, запускается процесс распознавания лиц (который позволяет определить, кто именно подошел к двери). Как только он определил гостя, компьютер сверяется с определенным списком — если я ожидал этого человека сегодня, то он впускает гостя и дает мне знать о его прибытии.
В реальной жизни корабль не существует, но человечество быстро движется к развитию самоуправляемого транспорта — беспилотных автомобилей, грузовой техники, поездов. Так, интеллектуальные системы современных авто уже помогают водителям на дорогах, а «умная» сельхозтехника собирает урожай с минимальными потерями.
Не остается в стороне и отечественный кинематограф, где также появлялись картины, поднимающие вопросы использования ИИ как помощника человека. Одним из самых популярных детских художественных фильмов за всю историю советского кинематографа, приобретя характер культового, стали «Приключения Электроника».
Приключения Электроника
Человекоподобные роботы также уже существуют, это не фантастика. Например, роботы японского робототехника Хироси Исигуру полностью повторяют облик создателя и могут заменять его во время лекций. С годами роботы учатся все точнее отражать эмоции и жестикулировать. Скорее всего, не за горами и появление полностью автономных устройств, выглядящих и ведущих себя, как люди.
Опенсорсные пакеты Nuclide, которые мы построили для работы с гитхабовским Atom, делают разработку гораздо легче. Среда разработки Buck, которую мы создали для работы над большими проектами, тоже сэкономила мне много времени. Наш опенсорсный искусственный интеллект FastText, который классифицирует текст, тоже стоит посмотреть одним глазом, если вы заинтересованы в разработке ИИ — да и вообще, покопайтесь в гитхабовском репозитории Facebook Research.
Такой тип визуальной системы у ИИ очень подходит для определенного числа вещей: например, он знает, когда Макс просыпается, и начинает играть ей музыку или урок языка мандарин [китайский диалект], или решает проблему контекста, зная в какой комнате мы находимся и точно отвечая на открытые запросы вроде «включи свет». Как и большинство аспектов этого ИИ, зрение является полезным, когда оно информирует более широкую модель мира, объединяя другие способности — например, зная ваших друзей и открывая им дверь по их прибытии. Чем больше контекста у системы, тем умнее она становится.
Я начал с создания чат-бота для [Facebook] Messenger для связи с Джарвис, потому что это гораздо легче, чем создать отдельное приложение. У Messenger очень простой фреймворк для создания ботов, который автоматически делает множество вещей за вас — включая работу и на iOS, и на Android, поддержку текста, изображений и аудио, доставку уведомлений и многое другое. Подробнее о фреймворке для ботов вы можете узнать на сайте messenger.com/platform.
Понимание контекста важно для любого ИИ. Например, когда я говорю своему [ИИ, Джарвису] включить кондиционер в «моем офисе», это означает совершенно иное, нежели когда Присцилла [жена Цукерберга] просит его о том же самом. Сколько различных проблем всплыло из-за этого! Или, например, если вы просите его приглушить свет или сыграть песню, не уточняя определенную комнату, ему нужно знать, где вы находитесь — иначе в музыка зазвучит в комнате Макс именно в тот момент, когда она спит. Упс.
Писатели-фантасты предсказали появление множества технологий, которые применяются сегодня и могут развиться в будущем. Так, все творчество Жюля Верна пронизано изобретениями, появление которых в реальной жизни он в той или иной степени предвидел. В рассказе «Один день американского журналиста в 2889 году», созданном, как нетрудно догадаться, за тысячу лет по описываемых событий, описан один рабочий день 25 июля 2889 года Фрэнсиса Беннета, директора голосовой газеты «Ирт геральд», наследницы легендарной газеты «Нью-Йорк геральд». Герои используют возобновляемые источники энергии, общаются друг с другом на расстоянии и заказывают готовую еду на дом:
Перед тем, как построить ИИ, мне нужно было написать код, который бы соединил все эти системы, написанные на разных языках программирования. Мы [семья Цукерберга] используем Creston для освещения, термостата и дверей, Sonos со Spotify для музыки, Samsung для телевизора, Nest для камер и, естественно, Facebook для моей работы. В большинстве случаев мне пришлось заняться обратным инжинирингом API для этих систем, чтобы заставить их отвечать на мои команды включить свет или музыку.
Марк Цукерберг создал искусственный интеллект Джарвис как из «Железного человека». Он управляет домом гендиректора Facebook, ставит ему музыку и выстреливает чистые серые футболки из специальной пушки. Мы ответили на главные вопросы об искусственном интеллекте от Цукерберга и перевели его оригинальный пост о процессе разработки Джарвиса.