Содержание статьи
Что за компания нейросеть
Где применяют нейросети и кто с ними работает
Принцип действия нейросети не похож на классическую программу. Такой сети не дают четкого алгоритма: ее обучают, чтобы она могла самостоятельно выполнять ту или иную задачу. В результате деятельность программы становится менее предсказуемой, но более вариативной и даже творческой.
Нейросети — это инструмент, который упрощает и ускоряет работу. В ближайшем будущем они вряд ли полностью заменят человека. С развитием ИИ перед специалистами будут стоять принципиально другие задачи: сформулировать запрос, обучить и обработать результаты, которые выдает программа.
В 2018 году OpenAI презентовала алгоритм GPT. По задумке создателей, он должен был обрабатывать 5Гб текстовой информации из книг, чтобы создать свой естественный язык. Через год появилась новая версия алгоритма — GPT-2. База данных для ее тренировки возросла в восемь раз. Нейросеть была обучена не только на книжных текстах, но и на интернет-контенте. Разработчики научили программу писать и переводить тексты, понимать логику повествования, обобщать информацию и достраивать предложения. IT-сообщество активно обсуждало нейросеть. Из возможностей GPT-2 выделяли создание текста новости на основе одного лишь заголовка. Позже разработчики отказались запускать обученную языковую модель. Они посчитали, что GPT-2 может распространять фейковые новости в Интернете. Следующую версию — GPT-3 — представили в 2020 году. База данных для обучения увеличилась в десятки раз: модель научилась создавать связные тексты на английском языке. Так, языковая программа освоила подготовку статей для СМИ. Мультимодальная языковая модель GPT-4 вышла в марте 2023 года. По данным разработчика, нейросеть обрабатывает инструкции сложнее, чем предыдущие версии продукта. OpenAI создавала совместный проект с GitHub — GitHub Copilot. Это AI-инструмент для разработки, который преобразует комментарии в исполняемый код. В нем есть функция автозаполнения кода. В 2021 году компания выпустила нейросеть DALL-E, а через год появилась улучшенная версия — DALL-E 2. Программа создает и изменяет изображения по описаниям. Самый известный продукт OpenAI — ChatGPT. Чат-бот с искусственным интеллектом вышел в ноябре 2022 года. Он умеет создавать любые тексты по запросу, генерировать идеи, поддерживать разговор.
Проект появился в Сан-Франциско в декабре 2015 года. Изначально это была некоммерческая лаборатория, которую создали бизнесмены Кремниевой долины. В их числе Илон Маск и Сэм Альтман, бывший глава венчурного фонда Y Combinator. На первом этапе инвестирования разработчики запросили миллиард долларов. Деньги, по их словам, требовались для создания AI-решений, которые бы «принесли пользу всему человечеству». Основатели планировали распространять разработки открыто, чтобы любой желающий мог воспользоваться нейросетями. В первые годы в лаборатории работали девять человек. Грэг Брокман стал техническим директором — такую же должность он занимал в компании Stripe. Руководителем по исследованиям назначили Илью Сукцевера, который учился у одного из AI-первопроходцев — Джеффри Хинтона. Остальные семь сотрудников пришли из престижных технологических университетов и IT-компаний, в том числе из AI-проектов Google и Facebook. В момент основания команда OpenAI поставила новаторскую задачу — создавать нейросети с открытым исходным кодом. Постепенно компания доказала: это не только возможно, но и востребовано. В 2016 году OpenAI выпустила два продукта. Первый — Gym, платформа для обучения искусственного интеллекта. Она тренировала нейросети на алгоритмических задачах. Затем вышел Universe — тренер программ-посредников между сервисами или сервисом и пользователем. Продукт выполнял рутинные действия вместо человека. Его инструменты исследовали происходящее на экране и работали через виртуальную клавиатуру и мышь. В 2018 год из совета директоров Open AI ушел Илон Маск. Официальная причина — возможный конфликт интересов с Tesla, специалисты которой тоже занимаются машинным обучением. Однако Open AI сохранила за Маском право вкладывать деньги и консультировать разработчиков.
Создавать контент для сайтов, социальных сетей и рекламных кампаний . Современные нейросети (например, ChatGPT и Stable Diffusion, доступные в РФ через условно-бесплатный сервис Fabula AI ) могут генерировать тексты, создавать логотипы, улучшать картинки и даже делать видео по текстовым описаниям.
Игровая индустрия активно внедряют нейросети в работу. Решения от Open AI применяют для создания реалистичных игровых вселенных и новых персонажей. В 2021 году Open AI презентовала платформу OpenAI Codex, которая позволяет создавать игры на JavaScript. В 2023 году вышла игра Generated Adventure, полностью созданная программами искусственного интеллекта — ее сюжет сгенерировал ChatGPT. В том же 2023 году на основе нейросети создали бота Open AI Five, который может проходить сложные миссии и побеждать профессиональных киберспортсменов.
Нейросеть — аналог мозга?
Синапсы. Синапс — это связь между нейронами. У каждого синапса есть веса — числовые коэффициенты, от которых как раз и зависит поведение нейронной сети. В самом начале, при инициализации сети, эти коэффициенты расставляются случайным образом. Но в ходе обучения они меняются и подстраиваются так, чтобы сеть эффективнее решала задачу.
С момента зарождения OpenAI — некоммерческий проект. Основатели считали, что искусственный интеллект должен быть доступен всем разработчикам. Илон Маск и Сэм Альтман не хотели, чтобы AI-технологии принадлежали какой-либо корпорации или государству. В 2018 году на сайте OpenAI появился устав. В нем прописано, что организация не преследует коммерческие цели. Однако со временем денежный вопрос стал подниматься чаще. Основатели поняли, что OpenAI требует вложений. Сэм Альтман писал в Твиттере, что обработка одного разговора чат-ботом стоит 10 центов. После этого стало известно и об убытках организации — 2022 году они составили 500 млн долларов. Инвестиции были необходимы, но также их нужно было возвращать. Чтобы продукт приносил доход, руководство создало компанию OpenAI LP (limited partnership). Дочерняя структура появилась в 2019 году и получила право на коммерческую деятельность. Open AI LP гарантировала инвесторам доход от прибыли. Компанией OpenAI LP владеют инвесторы, доля самой OpenAI — всего 2%. Через дочернюю компанию проходят средства для лаборатории. Она же продает товары и услуги Open AI. Материнская организация остается некоммерческой, но распределяет денежные поступления так, как считает нужным. Open AI назначает членов совета директоров OpenAI LP. А еще некоммерческая организация может наложить вето на планы «дочки», если они касаются ценностей проекта, лицензий или безопасности передачи технологий. Все это говорит о том, что OpenAI контролирует работу и решения OpenAI LP. Некоммерческая организация может не согласовать продажу технологий в какой-либо стране или снять руководителя дочерней структуры. В том же 2019 году появился самый крупный инвестор за всю историю проекта — Microsoft. Компания сразу вложила в компанию 1 млрд долларов. В январе 2023 стороны подписали многолетнюю сделку на 10 млрд долларов. Теперь Microsoft может получать доход от новых решений OpenAI. Партнерство позволило Microsoft и Open AI создавать супервычислительные технологии. Разработки OpenAI пригодились для AI-решений корпорации, а Microsoft Azure получил статус эксклюзивного поставщика облачных услуг для лаборатории. Microsoft владеет 49% OpenAI LP. Теперь корпорация может получать 75% всей прибыли компании, но только до достижения общей суммы в 10 млрд долларов. Когда Microsoft отобьет сумму вложений в проект, вся прибыль снова будет уходить OpenAI.
Обучение не так просто, как кажется. В нейронных сетях есть эффект переобучения: если тренировочных сетов слишком много и они слишком разные, нейросеть «теряется» и перестает эффективно выделять признаки. В результате она может, например, воспринять артефакт графики как чье-то лицо или перепутать мужчину с женщиной. Это происходит из-за размытия весов. И это не единственная ошибка, просто самая известная.
Процесс обучения бывает ручным и автоматическим и выглядит обычно так. Нейросети дают на вход разные данные, она анализирует их, а потом ей сообщают, каким должен быть правильный ответ. Сеть устроена так, что будет «стремиться» подогнать веса синапсов, чтобы выдавать верные результаты.
Анализировать и планировать промоактивности. «Магнит» проверяет правильность выкладки в розничных точках. Искусственный интеллект анализирует наличие товаров на полке и контролирует остатки на складах. Автоматизация сокращает время на проверку почти в 4 раза. Также компания использует нейросети для анализа и планирования промо-мероприятий . Алгоритмы подбирают ассортимент, глубину скидки и тип акции.
Пока неизвестно, начала ли лаборатория обучать новую нейросеть. В июне 2023 года Сэм Альтман сообщил: «Нам предстоит проделать массу работы, прежде чем запустим эту модель. Мы прорабатываем новые идеи. Мы считаем, что они нужны. Однако пока к запуску мы не приблизились». Глава OpenAI поделился этой информацией на одном из мероприятий индийской газеты Economic Times.
Кто инвестировал в OpenAI
А вот с текстовым контентом всё сложнее. Мы пробовали собирать с помощью нейросетей темы для контента — и нет, пока нейросети собирают поверхностные, сырые темы. А ещё пробовали с помощью ChatGPT написать сценарий чат-бота. Эксперимент показал, что более-менее интересный вариант нейросеть выдаст только если человек максимально подробно опишет, что в тексте должно быть, но тогда гораздо проще самому текст и написать :).
Нейросети решают задачи, которые традиционно выполняет человеческий интеллект: распознают и генерируют изображения, понимают смысл письменной и устной речи, анализируют данные и строят прогнозы. Для обычной программы это слишком сложно, так как нет однозначного или полностью известного алгоритма, который приводит к результату.
Но по какой логике пересчитываются веса, понять можно. В ходе обучения нейросеть анализирует данные, а потом ей дают правильный ответ. Этот ответ для нее — числовое значение. Поэтому она подгоняет веса так, чтобы в своей работе сеть приближалась к эталонному значению. Мы подробнее расскажем об этом процессе ниже, когда поговорим про обучение.
Перцептроны — Это классические нейронные сети, изначально однослойные, позже многослойные. Сейчас используются в основном для вычислений. Сверточные нейронные сети — Это многослойные сети, которые состоят из чередующихся сверточных и субдискретизирующих слоев и предназначены специально для работы с изображениями. Рекуррентные нейронные сети Их особенность в возможности последовательно обрабатывать цепочки данных и «запоминать» предыдущую информацию. Поэтому их применяют для работы с изменяющимися сведениями или длинными цепочками данных, например рукописными текстами. Генеративные нейронные сети Предназначены для создания контента. Иногда используются генеративно-состязательные нейросети — связка из двух сетей, где одна создает контент, а другая оценивает его качество.
Кроме обнародованных 11 млрд долларов от Microsoft, в OpenAI вкладывали деньги другие компании и физические лица. Полного списка инвесторов и сумм нет в открытом доступе. Известно, что на старте проект поддержали сооснователь LinkedIn Рид Хоффман, бывший генеральный директор PayPal Питер Тиль и другие частные инвесторы. Среди компаний отметились Amazon Web Services и Infosys. СМИ писали, что лабораторию финансировали венчурные фонды Khosla Ventures, Founders Fund и Суверенный фонд Сингапура.
В последние годы с развитием нейронных сетей их стали использовать в том числе в SMM. Уже сейчас есть блоги, где изображения и другой контент частично генерируются нейросетями. Применяют их и в развлекательных целях: различные сервисы «перерисовывают» лица людей, делают из них картины, персонажей мультфильмов, вставляют лица в отрывки из кино. Все это возможно благодаря машинному обучению и нейросетям.
Для эффективного обучения нужно много повторений. Иначе нейронная сеть будет работать неточно — ведь входные данные могут серьезно различаться, а она окажется натренирована только на один возможный вариант. Поэтому обучение проводится в несколько итераций и эпох.
Среди будущих задач — разработка GPT-5. Компания подала заявку на товарный знак летом 2023 года. Из документации пока неясно, какие именно новые возможности получит следующая версия продукта. Эксперты полагают, что GPT-5 может стать первым решением в истории AI, которое объединит работу с текстами, изображениями, видео- и аудиоконтентом.