Содержание статьи
4 причины, почему искусственный интеллект нужен даже гуманитариям, и ответы на самые стыдные вопросы о технологии будущего
Промпт-дизайнер (нейроиллюстратор)
Почему многие люди боятся ИИ, откуда взялся этот страх? Иван Оселедец: Отчасти это влияние поп-культуры, таких фильмов, как «Терминатор» и других ярких художественных произведений. У меня и моих коллег перед матричными умножениями — так, собственно, и работает нейросеть — страха нет, скорее интересует вопрос почему же она все-таки работает. Действительно интересно все это осознать, понять какими средствами и каким языком описать. Искусственный интеллект на основе нейросетевых моделей пережил первый пик интереса в 2016 году после матча нейросети AlphaGo и первого игрока мирового рейтинга в игру Го, Ли Седоля. Но тогда кроме специалистов на победу AlphaGo никто не обратил внимания. Что изменилось за 6 лет, почему с 2022 года ИИ постоянно находится на пике общественного интереса? Иван Оселедец: Ответ на этот вопрос очень прост — ChatGPT. Это действительно прорывная история в первую очередь за счет колоссально выросшего качества общения ИИ с человеком. На самом деле искусственный интеллект используется очень давно, например, в камерах, которые распознают лица с потрясающей точностью или в интернет-торговле. ИИ уже с нами, он уже здесь. Но такой формат взаимодействия с ИИ не производил такого впечатления на людей, как возможность лично пообщаться с ИИ. Главная идея ChatGPT заключалась в том, чтобы не обучаться на большом количестве произвольных текстов из интернета, а добавить в процесс обучения нейросетевой модели обратную связь от человека. То, что называется RLHF (reinforcement learning human feedback) Оказалось, что качественные данные и обратная связь от человека приводят к существенному скачку в качестве модели. То есть локомотивом всего хайпа вокруг ИИ стал один яркий продукт? Иван Оселедец: Да, локомотивом действительно стала новая методика обучения и конкретно ChatGPT, который Open AI выложили в публичный доступ. Как только люди стали пользоваться ChatGPT, это привело, к колоссальному взрыву интереса. Сейчас у многих людей эта штука открыта в ежедневном режиме, каждый для себя (по крайней мере я могу про себя и коллег говорить) находят там широкий спектр применений. Интересно, что хотя это очень мощная технология, на самом деле ее не очень сложно повторить. В последние несколько месяцев появилось нескольких открытых OpenSource моделей чуть меньшего размера. Так что это только начало. В ближайшее там время нас ждет очень много интересного.
У сильного ИИ есть младший брат — специализированный (слабый) ИИ. Он решает узкопрофильные задачи и очень многого не умеет. Тем не менее в том или ином виде его можно найти в любом смартфоне: автоматическая обработка или стилизация фотографий, распознавание лиц на снимках, перевод, голосовые помощники и многое другое — практические варианты использования слабого ИИ.
Осмысленный и структурированный лонгрид нейросеть написать пока не может. А вот создать десятки похожих карточек для интернет-магазина, сгенерировать темы для постов в соцсети или помочь с редактурой — вполне. На волне экспериментов в маркетинге появилась еще одна современная специальность для людей, работающих с текстом, — нейрокопирайтер.
Консалтинговое агентство KPMG называет данные валютой будущего. Но что не так с золотом, долларами, рублём? Дело в том, что с 1997 по 2002 год человечество сгенерировало больше информации, чем за всё время до этого. С каждым годом люди производят на 30% больше данных, чем в предыдущем. И чтобы справляться с таким потоком информации, разбираться в программировании и анализе данных сегодня должны уже не только «технари». Журналисты, врачи, социологи, психологи, маркетологи, которые могут автоматизировать свою работу, экономят время и силы, успевают выполнить больше задач и, как следствие, получают более высокие зарплаты.
Данный материал является частью большого проекта, посвященного развитию у детей личностного потенциала и ключевых компетенций XXI века. О чем проект? Мы рассказываем о ребенке и его развитии как о личности, а не объекте образовательного процесса. Мы объясняем, как меняется мир, и показываем, какие навыки помогут ребенку гармонично жить в меняющейся реальности. Другие материалы проекта раскрывают темы развития социально-эмоционального интеллекта, финансовой и цифровой грамотности, когнитивного развития, инклюзии в школе и др. Проект подготовлен совместно с сайтом об образовании и воспитании детей Мел.
Что вы думаете относительно социальных последствий массового внедрения ИИ? Насколько оправданы опасения его противников, что ИИ лишит их работы, профессии? Иван Оселедец: Если ИИ сможет автоматизировать рутинные процессы в этом нет ничего плохого. Люди смогут сфокусироваться на более интересных и творческих вещах. Но пока не все так просто. Возьмем, программирование и написание кода. Уже было несколько случаев, когда нейросеть за 3 минуты писала код. Очень правдоподобно писала, но с такими хитрыми ошибками, что человек потом 3 часа искал этот несчастный баг. Если же учесть, что программистов сейчас не хватает во всем мире, рынок труда перегрет, то в том, что самый простой код будет писать ИИ нет ничего плохого. Как далеко мы сейчас находимся от того, что называют «общим искусственным интеллектом»? Он в принципе возможен? Иван Оселедец: На эту тему очень много спекуляций, но если бы год назад я сказал «вряд ли» или «надо подождать», то с появлением ChatGPT многое изменилось. Почему бы те вещи, которые он сейчас делает, не рассматривать как проявление общего искусственного интеллекта, который отвечает на многие вопросы лучше среднестатистического человека, решает разнообразные задачи, выполняет роль помощника. Что тут не соответствует понятию «общего искусственного интеллекта». Кейсы с использованием современного ИИ — это очень многозадачные истории и даже в некоторых случаях достаточно креативные. В этом смысле мы подошли очень близко к общему ИИ. Он неожиданно для многих появился в форме чат-бота, который обрастает различными модальностями, то есть, уже работает не только с текстом, но и с изображениями и видео. Можно считать, что мы уже живем в эпоху более или менее «общего ИИ». Человечество в каком-то смысле пересекло эту условную черту. Конечно, можно спорить относительно определения общего ИИ, но факт остается фактом, поведение современных больших языковых моделей принципиально отличается от того, что мы видели раньше и их действительно можно назвать прототипами общего ИИ. Каково на ваш взгляд сейчас место России в мировой ИИ-индустрии в науке о данных? Иван Оселедец: В области Data Science (науки о данных), думаю, мы входим в Топ 15-20 стран. Это достаточно легко измерить количеством публикаций на конференциях. Хотелось бы, конечно, больше так как в этом нет ничего сложного. Data Science наука достаточно своеобразная и нетипичная для нашей академической традиции, так как она не подразумевает каких-то глубоких фундаментальных исследований, а представляет собой набор быстрых и успешных рецептов, которые люди придумывают и используют. Если говорить с точки зрения развития прикладных технологий у нас все очень неплохо. Я обычно привожу как пример обработку медицинских изображений, где по многим показателям Москва находится в мировых лидерах. Тут опять все сводится к тому, что нужно правильно собрать данные и обучить модели, но тем не менее, такого внедрения этой технологии, как в Москве, нигде в мире практически нет. Сегодня каждая уважающая себя российская IT-компания или банк имеет у себя отдел, занимающийся машинным обучением. В «Сколтехе» есть свои научные группы, они работают, появляются новые, но я думаю, что нужно раза в четыре-пять больше научных групп, работающих в области ML (машинного обучения). В целом же ситуация с искусственным интеллектом в стране неплохая, туда вкладываются деньги, есть проекты, есть поддержка. Обучение больших нейросетевых моделей требует значительных вычислительных ресурсов. Насколько реально создавать суперкомпьютеры в текущих условиях в России? Что для этого нужно? Иван Оселедец: Санкционная история просто повышает стоимость вычислительных ресурсов и их доступность. Но при этом программное обеспечение, которым все пользуются, не очень эффективно. Сейчас вычислительный кластер достигает при стандартной методике обучения не более 50% от своей максимальной производительности. Если же, условно, приблизиться к 100%, можно в 2 раза ускорить обучение на том же самом «железе». Одной из важных задач является разработка новых эффективных вычислительных методов обучения нейросетей, которые позволят снизить время обучения и потребление электроэнергии. Мы ведем над этим активную работу. Ситуация с вычислительными мощностями она в везде не очень хорошая, а не только в России. На рынке графических чипов, необходимых для обучения нейросетей, есть фактический монополист — компания NVIDIA, и все в мире осознают это, как глобальную проблему. NVIDIA ушла так далеко вперед, что сейчас проще купить у них процессор, чем пытаться разрабатывать свой. Даже Google для своего последнего вычислительного кластера просто закупила у нее 26 тысяч графических карт, хотя у них есть свой специальный процессор для обучения нейросетей. Наличие такого монополиста не очень хорошо, но при этом надо понимать, сколько стоит разработка каких-то своих решений. Тут тоже есть варианты, что можно сделать, но это все средне- и долгосрочные перспективы. Пока же есть один путь — закупка графических карт и оптимизация алгоритмов. Нужно думать головой, а не просто механически увеличивать размер модели и объем железа необходимого для ее обучения. Пример с ChatGPT показал простую вещь. Можно не обучать модель на сто миллиардов параметров, а создать и обучить модель в несколько миллиардов параметров. Это сокращение сложности и требуемых для обучения мощностей и электроэнергии в десятки раз. При этом можно получить сравнимое качество модели за счет более оптимальных алгоритмов обучения и грамотно подобранных данных.
Передо мной стояла задача разработать сюжет и собрать видеоряд продолжительностью более трех минут в единой стилистике со сложной, реалистичной анимацией. В работе над клипом не использовались футажи. Все, что вы видите, — это результат работы с нейросетями без какого-либо предварительно отснятого и обработанного материала. Для генерации видео использовал нейросеть Runwayml. Она выдает наиболее стабильный и предсказуемый результат, при этом обеспечивает достаточную динамику анимации в кадре.
«Нейронная сеть написала сценарий для фильма», «ИИ превратит ваши фотографии в картины импрессионистов», «Беспилотные трамваи и поезда вышли на маршруты в Англии и Китае» — ещё недавно такие новости показались бы нелепыми шутками, однако сегодня это реальность. Она вызывает не только восторг, но и страх — остаться без работы, пасть жертвой восстания машин. Но вместо того чтобы бояться, лучше учиться и адаптироваться. Рассказываем, зачем осваивать ИИ и почему никогда не поздно заняться этим.
Стать (или остаться) востребованным профи
По статистике международного сервиса по поиску работы LinkedIn, только с 2018 по 2019 год количество вакансий для специалистов по ИИ выросло на 56%. А средняя зарплата в США составила свыше 650 тысяч рублей в месяц. В России, конечно, цифры чуть более скромные, но не менее впечатляющие. Минимальная зарплата начинающего специалиста, по данным HH, — 115 тысяч рублей.
Системное мышление важно, поскольку большинство аналитиков работают в коммерческих компаниях, им нужно мыслить наперёд, оценивать возможные риски, понимать бизнес-процессы, чтобы оптимизировать их. Также, поскольку большая часть продуктов, использующих технологии ИИ, ориентированы на потребителей, специалист должен обязательно помнить об их потребностях.
Мы собираем данные (чем больше, тем лучше), состоящие из объектов и ответов. К примеру, мы хотим создать робота-офтальмолога, который сможет диагностировать глазные заболевания. В таком случае объекты — это изображения больных и здоровых глаз, а ответы — диагнозы.
В этом году я начал использовать нейросети в своей работе на постоянной основе. Я использую AI для повседневных, мелких задач. Когда нужно быстро изобразить концепт-арт в дизайн-документе, собрать прототип интерфейса, оперативно найти ошибку в коде, составить список или кратко резюмировать большое количество информации. Раньше на подобные задачи могло уйти несколько часов, сегодня время сокращается до пяти минут. Нейросети пока откровенно плохо пишут и делают вторичный дизайн. Но если дать модели подробную задачу, она делает приличный концепт.
Многие компании уже используют изображения, сгенерированные нейросетью, в рекламных компаниях. Например, Levi’s намерена заменить нейросетью моделей. Сейчас в карточке товара на сайте бренда используются реальные фото, а с помощью ИИ покупатели могут посмотреть, как вещь будет выглядеть на человеке с похожей внешностью и фигурой.
Среди претензий, которые предъявляют к разработчикам нейросетей, есть такая, что они не могут объяснить, как нейросеть пришла именно такому ответу, а не к другому. Это проблема? Иван Оселедец: Да, это большая проблема и для нее пока нет каких-то хороших решений, даже для обычных моделей, которые распознают лица с точностью до 99,999%. Сейчас пытаются те же языковые модели, использовать для генерации объяснений, но какого-то вот разумного работающего подхода для повышения объяснимости работы моделей пока нет. Более того есть много примеров, когда можно злонамеренно модифицировать вход, модифицировать текст, модифицировать картинку и модель вообще начинает что-то другое предсказывать. Это одна из недавно открытых больших проблем. Но бизнес это не очень интересует, они говорят — вот у нас есть нейросеть с точностью работы 99,99% и больше нам ничего не нужно. Человек и то чаще ошибается, а почему эта модель работает хорошо нам неважно. Сейчас в целом доминирует бизнес-подход, когда компании готовы внедрять ИИ для экономической выгоды. Либо, если они боятся и переживают, что цена ошибки будет слишком высока, они не внедряют ИИ, а просто используют его как помощника, как например в медицине.
Прокачка навыков
Если правильно написать запрос к нейросети, можно не устраивать дорогостоящие фотосессии и сэкономить на иллюстрациях от профессиональных художников. Создать картинку по описанию за несколько минут — задача, посильная для нейроиллюстратора. Это современная ИИ-профессия для тех, кто хочет работать с визуалом.
Безусловные лидеры внедрения ИИ сейчас сервисы и сфера услуг. Почему ИИ-продукты так медленно внедряются в промышленность сельское хозяйство? Там же очевиден огромный потенциал для ИИ. Иван Оселедец: В сельском хозяйстве действительно очень большой потенциал для ИИ-решений, связанных с обработкой спутниковых снимков, анализом различных рисков и предиктивной аналитики на основе этих данных. Просто есть высокая инерция, которая тормозит внедрение, плюс такой аспект, как стоимость труда. В тех агрокомплексах, где она невысокая, нет мотивации для оптимизации производственных процессов. Имеется еще и «человеческий фактор». Специалисты в прикладных областях часто рассматривают датасайентистов как «персональных врагов», которые учат их тому, чем они занимаются много лет. не являясь специалистами в их области. Если же говорить о промышленности, то ИИ можно использовать практически в любом технологически сложном производства, например, для контроля процесса сварки в режиме реального времени. Причем это все можно делать уже на готовых технологиях, не разрабатывая и не обучая нейросеть с нуля.
Эффективная коммуникация — залог продуктивной работы. Стереотип о программисте как о замкнутом «ботанике», который только и умеет, что кодить, безнадёжно устарел. В работе аналитиков полно сложных технических терминов, нюансов и тонкостей, которые они должны лаконично объяснять руководству. Легко ли это сделать? Едва ли. Вот почему важно уметь ясно излагать свои мысли и объяснять даже самые замысловатые математические конструкции доступным языком.
Раньше, чтобы создать алгоритм, программисты придумывали и прописывали правила формата «если… то…». Их было очень много. И всё равно алгоритм не знал, как вести себя за пределами заданных ему заранее условий. Сегодня же всё работает по технологии машинного обучения.
Помимо новых профессий, связанных с искусственным интеллектом, появились также возможности усовершенствовать процессы на любом рабочем месте. Например, те же иллюстраторы могут использовать ИИ, чтобы сделать набросок или собрать композицию будущей иллюстрации, подобрать сочетание цветов. Писатели — чтобы найти идеи для новых сюжетов, программисты — чтобы сэкономить время на написание стандартных частей кода.
Как вы относитесь к письму организации Future of Life, которое подписали Илон Маск, сооснователь Apple Стив Возняк и другие известные персоны, относительно приостановки разработок в области ИИ ввиду его потенциальной опасности для людей? Иван Оселедец: Я, конечно, не поддерживаю идею что надо что-то остановить, прекратить, тем более что некоторые люди, которые подписывали это письмо, например Илон Маск, потом вкладывали деньги в свою компанию по разработке ИИ. Есть и такие экзальтированные исследователи ИИ, как Элиезер Юдковский, который дошел до того, что фактически призывает бомбить дата-центры, где обучают нейросетевые модели. Все это выглядит очень странно. Действительно, сейчас технологии машинного обучения хорошо работает там, где цена ошибки не высока. Никто не может дать гарантии стопроцентно безошибочной работы ИИ, но мы и для человека не можем дать такой гарантии, а ошибки человека, которые случаются, устраняем путем внесения изменений в регламенты, обучение, в подготовку. Такие же процедуры работают и для искусственного интеллекта. Если, например, мы поставим нейросетевую модель управлять транспортом, и она перестанет корректно работать, надо будет разобраться, почему это произошло и решить проблему так же, как и в случае с обучением человека. Мне кажется, сейчас надо максимально вкладываться в развитие ИИ. Естественно, если в какой-то момент мы упремся в технологический или иной барьер, тогда и надо будет думать, что делать дальше. Однако, многие задачи, которые раньше считались для ИИ сложно решаемыми, современные большие языковые модели (LLM) решают легко. Это замечательно, значит, надо учиться этими моделями пользоваться, надо учиться с ними взаимодействовать. То, что происходит сейчас с ИИ сравнимо с предыдущими технологическими революциями, но я опять же не вижу в этом ничего страшного или критичного. В мире, будем честны, гораздо больше более серьезных проблем — голод, болезни, стихийные бедствия — чем гипотетический захват власти над миром каким-то супермозгом.