Содержание статьи
Коварный алгоритм. Как искусственный интеллект управляет человеком
Расскажите, откуда вы начинали и как добрались до нынешней должности?
Как именно устроен этот процесс, выяснили ученые из Принстонского университета, проанализировав 10 тысяч сайтов для продажи товаров в интернете. Они выделили несколько разновидностей манипуляций людьми с помощью FOMO: всплывающие объявления о вымышленных покупателях, которые «невероятно сэкономили, купив этот товар на этом сайте», предложение добавить в корзину сопутствующие товары, всплывающие сообщения о завершении акции и ограниченном количестве товара, намеренное усложнения процесса отмены еще не сформированного заказа. Блогеры, продающие инфопродукты, часто прибегают к давлению на аудиторию через чувство стыда: «Если вы не пойдете на мой курс, ничего страшного, не все готовы выделиться из стада посредственностей». Или, например, кнопки отказа от подписки на рассылку могут подписать «Нет, спасибо, я отказываюсь получать выгодные предложения».
В ближайшем будущем, мне кажется, постепенно войдут в нашу жизнь метавселенные. Сейчас это очень популярно, туда идут деньги. А мы понимаем, что любые исследования состоят из двух вещей: можно ли на этом заработать, и готовы ли мы с точки зрения технологий. Тот же самый перцептрон [разработанная в 1958 году модель восприятия информации мозгом – прим. ред.], на основе которого сформулирована концепция нейросетей, это были 60-70-е годы прошлого века. Все достаточно давно было описано – логика принятия решений, почему да как это устроено. Но стало популярно в последние полтора десятка лет просто потому, что вычислительные мощности стали доступны. Для метавселенных у нас это есть, мы с этим будем много сталкиваться.
Если человек имеет желание работать в сфере, связанной с большими данными, то, заканчивая или ещё поступая в ВУЗ, он не до конца понимает, как будет выглядеть мир, в котором он окажется. Когда мы поступали, страна сильно изменилась, как и сама отрасль. Сейчас будет то же самое, это регулярно происходит. Таково мое личное мнение, но я здесь неспециалист, я первый раз живу.
Так возникает большое количество проблем. Обычно всеми любимый Excel работает со всем объемом данных, но когда у вас их очень много, вы можете оперировать только их ограниченным количеством. Вам нужно из огромного Data Lake, хранилища, их извлечь, с ними что-то сделать, чтобы эти данные были пригодны для работы, и после этого на них уже выстраивать аналитику. Так вот, проблема заключается не только в том, чтобы извлечь их, но и держать готовыми. Этим всем занимается команда ETL [буквально «извлечение, преобразование, загрузка», то есть управление хранилищами данных – прим. ред.], связанная с инженерией данных, то есть и с этими командами тоже приходилось много взаимодействовать.
Их очень много. Основная – как много людей живет в том или ином районе, какой там уровень среднего дохода. Из этого мы уже понимаем, какая у нас ожидаемая маржинальность и, условно, какой процент должен быть дорогих вин. Если мы открываемся где-то рядом с дачным поселком, у нас будет один ассортимент, а если в центре Москвы, то немножко другой. В каких-то местах он вообще не будет сильно различаться, потому что молоко, хлеб, яйца, бананы есть везде, но вот набор тех же вин – разный. На самом деле, там чуть больше учитывается факторов, но основные переменные – такие.
Возьмем в пример тот же медтех. Мы понимаем, что если у человека есть в легочной альвеоле потемнение, то с высокой долей вероятности он чем-то заболеет. В рамках одного специалиста это выяснить очень тяжело. Обычно нужно, чтобы люди собрались, всю информацию каким-то образом обработали и вместе пришли к выводу. Машина просто может найти этот паттерн, когда ей не задают даже вопрос. Она сама для себя принимает решение: «вот у меня есть причина, а есть следствие». Если совсем упрощать, то это работает так.
Как здесь появился искусственный интеллект? Это просто как бы стало логичным продолжением аналитики?
Алгоритмы соцсетей и поиска подбирают контент, который нравится пользователям, чтобы они дольше оставались онлайн и приносили прибыль владельцам платформ. Но позволяет ли это управлять людьми? Как маркетологи и политтехнологи манипулируют нами при помощи алгоритмов подбора рекомендованных новостей или товаров и есть ли от них какая-то польза для потребителя? Екатерина Мищенко проанализировала свежие исследования Science, Nature, New Media & Society и опрос НИУ ВШЭ и рассказывает, способна ли перенастройка алгоритмов ленты соцсетей изменить наши убеждения
Фундаментально ритейл, в котором я работаю, не изменился с того момента, как торговля появилась как вид. Это огромное количество продавцов, они продают товары, и цена зависит от важности для покупателя этого товара, от его редкости и от накладных расходов. Мы играем в ту же самую игру. Нужно что-то где-то купить, желательно дешево и много, привезти это ближе к людям, продать максимально мелкими и получить максимальную выгоду. Это все прикладные и понятные задачи. Для ритейла важны прогнозирование спроса, работа с ассортиментом, с географией, то есть где мы что продаем, где лучше открывать магазин, а где хуже, и все, что связано с управлением ценой. Можно еще промоушен сюда включить. Это все базовые вещи, вокруг которых строится наша основная работа. Это менее интересно, чем разворачивать компьютерное зрение в магазинах или ставить кассы самообслуживания с биометрией. Но с точки зрения cost/income, то есть того, сколько вы вложили и сколько получили из бизнеса, это основное, чем мы занимаемся.
Как стать специалистом по ИИ в 2022 году?
Я бы начал с математики, потом придется что-то выучить – либо язык программирования R, либо Python, чтобы со всем этим взаимодействовать. Но вообще отраслевой стандарт у нас Python. Нужно оказаться в компании, которая готова в это вкладываться. Я с огромным уважением отношусь к людям, которые занимаются фундаментальными исследованиями, наукой, или которые сами для себя пытаются что-то делать. Но если вы не прикладываете это к практике, если нет проверки ваших идей, гипотез, разработок о реальность, то их ценность и для вас снижается. Когда вы не видите подтверждения, что вы сделали что-то хорошее, это полезно и зарабатывает деньги – пусть не вам, но желательно, конечно, вам, – то мотивация теряется.
Соответственно, искусственный интеллект может принять оптимальное решение в заданных параметрах, он может запомнить оптимальное решение и постоянно искать вещи, которые ему помогли, но не может выйти за рамки первоначально поставленной задачи, и он не может придумать что-то новое. Это мы уже сейчас в область философии уходим, но есть такой термин, как сильный искусственный интеллект, он тоже достаточно спорный. Это ситуация, когда машина может самостоятельно поставить себе задачу, самостоятельно оценить новое для себя решение и обучаться дальше. Например, когда машина придумывает тот цвет, которого не сделал еще человек.
Говоря о точке входа в профессию, нужно тоже понимать, куда ты хочешь попасть как с точки зрения отрасли, так и с точки зрения роли. Есть классический треугольник: одна сторона связана с инженерией, другая – с математикой, а третья — с бизнесом. Ты можешь быть неплох в математике, хорошо понимать, как устроен бизнес. Очевидно, что тогда ты будешь неплохим дата-аналитиком, и когда тебе скажут: «Посчитай нам RTO [показатель допустимого времени для восстановления данных – прим. ред.]» или какой-то другой бизнес-показатель, продуктовый показатель, ты будешь в этом хорошо ориентироваться. Но когда тебе нужно будет настраивать процесс поднятия данных, перелив их на какую-то витрину, в таблицы, чтобы ты мог этим пользоваться, у тебя компетенций не хватит. Тут нужны люди, которые связаны с инженерией данных, то есть немного другая роль.
Я бы использовал какое-то фундаментальное образование – физика, математика, где это возможно, Computer Science, прикладная математика, информатика – все, что связано с фундаментальными знаниями, сверху которых можно достраивать. Если вы шесть лет не учили теорию вероятности, статистику, вы вряд ли сможете хорошо организовывать и проводить глубинные исследования, связанные с математикой. Вот выучить Python можно достаточно быстро. Но выучить его – это то же самое, что научиться работать в Figma, просто дольше. Что делать этой Figm’ой или Python’ом – вопрос все равно остается. Вы либо понимаете, для чего его применять, и тогда говорите: «Я буду заниматься разработкой» – тогда вам большие данные не очень как бы и нужны, потому что вы, условно, делаете сайты. Это история с ядром, с пониманием, как устроены процессы, то есть фундаментальная наука. Поэтому я бы, наверное, начинал с этого.