Содержание статьи
С учителем и без него: как обучаются нейросети
С учителем
Метод обучения с учителем ( supervised learning) аналогичен получению знаний в школе, где нейросеть выступает в качестве ученика, а человек — в роли преподавателя. Роль учителя заключается в том, чтобы подать на вход модели исходные данные и их «расшифровку » . По аналогии с математическими задачами это будет «вопрос » и «правильный «ответ » (метка). Например, при обучении задаче классификации изображений каждой отдельной картинке будет присвоена метка, означающая класс изображения (например, кошка или собака на фото). Так происходит настройка параметров для минимизации ошибок между собственными предположениями и « правильными ответами» (метками). Сопоставляя их из раза в раз, нейронная сеть б удет самос тоятельно обучаться отвечать и на последующие запросы правильно уже без помощи человека.
Зачем их бояться? Прогресс в масштабах человечества идёт независимо от моего мнения или мнений других людей. Это как переживать из-за погоды. Поскольку я не могу на это повлиять, считаю, что нужно возглавить процесс: больше узнавать о технологиях, изучать их, развивать и не оставаться в стороне.
Прохождение игр — часто встречающаяся задача, которую решает обучение с подкреплением. Так, например, алгоритм Q-обучения (Q-learning) часто используется в играх — например, для тренировки агента прохождению знакомой всем «Змейки » . Другой пример — нейросетевая модель AlphaGo, которая обучена играть в го на уровне мировых чемпионов.
Нейросети , прошедшие обучение без учителя, не хуже предыдущих решают задачи кластеризации. Деление большого количества данных на группы способна совершить каждая обучающаяся модель, а далее с уже первично отсортированными сведениями могут работать люди или более тонко настроенные модели. Помимо задач группировки, нейронные сети умеют определять связи в данных. Этот механизм часто используется в маркетинге: анализируя историю покупок, искусственный интеллект предполагает, какие товары и услуги дополнительно предложить этому же человеку. Детектирование аномалий — еще одна профильная задача самостоятельного машинного обучения, решаемая автокодировщиком Autoencoder.
Шедеврум — это интересная, фановая B2C-история, но наша цель — расти дальше. Есть планы внедрения в B2B, рекламу и много ещё куда. Например, Яндекс использует в рекламе иллюстрации, созданные той же нейросетью, что работает в Шедевруме. Если у рекламодателя нет собственной картинки для объявления, он может выбрать из предложенных нейросетью.
Всё верно. Сначала появилась нейросеть, потом — Шедеврум и его задачи. Идея с Шедеврумом возникла в конце 2022 года. На тот момент у нас уже была обученная сеть, а потом мы к ней добавили первую версию бэкенда, который генерирует изображения. И команда сделала всё за новогодние праздники.
Как вообще работает Шедеврум? Как вообще работает Шедеврум?
Нейросети можно использовать как для решения бизнес-задач, так и для развлечения. Мы постоянно в поисках новых применений. Уже сейчас нейросеть может придумать костюмы и декорации, разработать креативные концепции — помогать людям в их профессиональной деятельности. Отправить запрос на коммерческое использование контента из Шедеврума можно через форму обратной связи — ответ придет в течение 5 рабочих дней.
Отсутствие контроля человека при тренировке моделей увеличивает вероятность ошибок. Самостоятельный анализ данных может привести к неверному объединению или группировке по тем признакам, которые не важны для человека. Кроме того, подобная подготовка требует большего количества времени и информации — ведь для того, чтобы без подсказок учителя сделать верные выводы, нужно проанализировать больший объем информации, чем с ними.
Недавно Шедеврум научился генерировать короткие видеоролики! Нейросеть создаёт видео длиной четыре секунды с частотой 24 кадра в секунду. После публикации ими можно поделиться с друзьями или сохранить в формате MP4. Чтобы получился ролик, сперва нужно описать текстом то, что хочется увидеть. В ответ приложение предложит четыре варианта первого кадра и набор анимационных эффектов для создания движения. Нейронка берёт за основу выбранное пользователем изображение, создаёт набор его изменённых версий и объединяет всё выбранным эффектом. Сейчас их семь: зум (приближение), таймлапс (ускоренная перемотка), полёт, панорама, вращение, подъём и морфинг (постепенное изменение).
Тренировочный набор данных для этого типа обучения важно разметить, то есть каждому примеру сопоставить результат, который модель должна получить. Для этого над входным датасетом следует предварительно поработать: учитель собирает его заранее, просматривает и размечает в понятном для обработки виде.
Главная проблема такого формата обучения — необходимость сбора и обработки огромных массивов информации на соответствующих высоких мощностях. Это длительный, дорогостоящий и технически сложный процесс, позволить себе который могут только крупные компании, не говоря уже о частных лицах. Кроме того, обучение с учителем подходит далеко не для всех типов данных. Оно предполагает, что в дальнейшем система будет работать только с информацией, аналогичной обучающему датасету, иначе эффективность ее функционирования точно предсказать невозможно.
В частности, с помощью компьютерного зрения мы учим программы на лету распознавать нужные объекты. К примеру, в любом супермаркете у дома есть камеры. А ещё есть сервер, который обрабатывает видео: нейросети следят, чтобы полки в магазине всегда были заполнены товаром. Если где-то мало помидоров или детского питания, нейронка сигнализирует человеку — и он добавляет товар.
Обучение с учителем используется для нейросетей , которые в дальнейшем будут решать задачи классификации: получать на входной слой большой объем данных и разделять информацию по заданным категориям. Этот механизм лежит в основе разных функций: модель может в будущем специализироваться и на генерации текста или продолжении предложений (нейронная сеть LSTM), и на идентификации и классификации картинок (сверточная нейронная сеть CNN). Кроме того, обучение с учителем позволяет модели успешно работать с прогнозами: оценивать динамику спроса на товар и менять цену и другие количественные характеристики для максимизации выручки или строить прогноз на бирже.
В целом всегда можно улучшать качество изображений, их красоту, естественность. Есть сложные штуки вроде пальцев и лиц людей: сейчас сгенерированное изображение человека сразу видно по тому, как плохо нарисованы пальцы. Нейросеть в датасете видит руки в разных ракурсах, и где-то видно два пальца, а где-то — все пять. И поэтому она рисует что-то среднее между всеми изображениями, которые видела.