Содержание статьи
Как работает нейронная сеть: разбираемся с основами
Смогут ли нейросети заменить людей
Volkswagen. С 2016 года автомобильный концерн ведет сотрудничество с компанией, которая функционирует на базе ИИ. Инструментарий обеспечивает аналитику, оптимизирующую рекламные процессы и бюджет. Используются рыночные данные (конкуренты, стоимость топлива, спрос). Сотрудничество принесло хорошие плоды: продажи Volkswagen !Up увеличились примерно на 14%, других моделей – на 20% и более.
На финише выводится готовое изображение, которое пользователь может сохранить. Доступны новые генерации, если результат не соответствует ожиданиям, а также возможность изменения получившегося визуала. Вместо текстовых запросов можно использовать реальные примеры, загружая собственные картинки, что помогает сети обучаться. Стоит помнить, что по одному и тому же промту выдаются разные варианты, независимо от количества генераций.
Российский сегмент генеративного ИИ развивается темпами, существенно опережающими мировые. В 2023 году выручка крупнейших ИИ-поставщиков выросла практически на 90%, но это не предел. Участники рынка отмечают, что качество продуктов не уступает зарубежным аналогам, а государственные программы поддержки и ориентирование на импортозамещение позволяют создавать/дорабатывать то, чего не хватает клиентам. Что сейчас в тренде и на пике развития:
Основа взаимодействия с генеративным ИИ – запросы пользователей, которые они могут вводить как голосом, так с и помощью клавиатуры. При составлении промтов нужно использовать формулировки, применимые для обычных технических заданий, ориентированных на специалистов. Чем конкретнее изложено требование, тем релевантнее будет результат. В помощь – следующие рекомендации:
ИИ качественно выполняет проверку, улучшение и дополнение кода. Поддерживают более 50 языков программирования, некоторые сети способны писать код на базе запросов на естественном языке + автодополнение. Доступны инструменты для создателей сайтов, компьютерных программ, мобильных приложений, прочих продуктов.
Готовый сайт можно легко изменять под требования проекта, реализован дружелюбный визуальный редактор с интуитивным интерфейсом. В течение 10 дней функционал платформы – бесплатный, потом можно выбрать тариф по цене от 199 рублей в месяц. При оплате за год есть скидки и домен в подарок.
Существует три основных проблемы работы с сетями — это явления забывчивости и переобучения, а также непредсказуемость. В биологических нейронных сетях они тоже есть, но мы их корректируем. В искусственных нейросетях аналогично применяются методы корректировки, но это сложнее и не всегда может быть эффективно. Забывчивость. Представьте, что вы попали сразу в несколько незнакомых ситуаций, опыта для которых ранее не было. Скорее всего, вам будет тяжело эффективно работать. Даже простые, но отличающиеся действия будут вызывать стресс, вы будете допускать больше ошибок. В теории нейронных сетей это называется забывчивостью: программы плохо реагируют на большое разнообразие ситуаций. Если обстоятельства все время меняются, нейросеть будет пытаться подстроиться под каждое из них, и в результате точность решений упадет. Но если человек еще может сориентироваться в незнакомой обстановке, то программе это сделать сложнее, ведь она — «вещь в себе», лишенная нейропластичности. Переобучение. Это явление, когда модель хорошо объясняет только примеры из обучающей выборки, адаптируясь к примерам оттуда, вместо того, чтобы учиться классифицировать что-то другое, не участвующее в обучении. Если вы когда-нибудь смотрели на автомобиль и видели, что фары похожи на глаза, а решетка радиатора — на рот, вы понимаете, как это работает. Нейросеть точно так же начинает путаться. Но ресурсов человеческого мозга хватает, чтобы понять, что машина — не настоящее лицо. Программа понять это не может и в подобной ситуации способна действительно выдать результат, что на картинке изображен человек. Еще один пример переобучения можно привести для сетей, которые создают что-то новое, например стиль. Вы, наверное, замечали, что у реальных художников и писателей есть свои характерные приемы, а их произведения со временем становятся все более похожими друг на друга. Это тоже пример переобучения — и генерирующие контент нейросети также ему подвержены. Непредсказуемость. Это прямое следствие закрытости и автономности нейронов. Сложно предугадать результат работы нейросети, будет ли она корректно работать в решении той или иной задачи. И если с предыдущими ошибками можно бороться благодаря правильным алгоритмам обучения, то непредсказуемость не пропадает. Это не стандартная программа, которая выдает известный результат для каждой ситуации. С непредсказуемостью тоже борются: точность можно повысить, если использовать подходящую архитектуру. Не обязательно более сложную — с некоторыми задачами хорошо справляются, наоборот, более простые сети. Но это дополнительно усложняет работу над нейросетями, особенно когда результат работы критичен.
Сейчас на слуху «творчество нейросетей»: сгенерированные машиной тексты и стихи, несуществующие картины и фотографии людей, почти похожие на настоящие. Для человека вне IT это выглядит как чудо. Но на самом деле нейронные сети хорошо объясняются математически, хотя результат их работы действительно невозможно предсказать.
Какие задачи умеют решать нейросети
Разобрали техническую сторону функционирования нейронных сетей, перейдем к практической части. Сложные процессы и формулы остаются недоступными для пользователей: они вводят запрос, через несколько секунд получают результат. На практике все сложнее, для примера возьмем нейронку по генерации картинок:
Levi’s. Бренд начал работу с компанией Lalaland.ai, специализирующейся на нейросетях. Основной продукт – генерация AI моделей на основе искусственного интеллекта: они практически неотличимы от реальных, что позволяет хорошо экономить на фотосессиях.
Нейросети используются в огромном количестве сфер, в первую очередь в тех, где от машины нужна функциональность сродни человеческой. То есть в ситуациях, где нет четко заданного скрипта, описывающего каждый конкретный случай; входные данные могут быть любыми, поэтому нужно уметь обрабатывать все возможные варианты. Хороший пример — робот-ассистент или подсказки в поле поиска. В свое время именно поисковые системы дали толчок развитию методов искусственного интеллекта. Пока с нейронными сетями работают в основном большие компании и холдинги. Для того чтобы создать нейросеть, способную достаточно грамотно работать в сложных условиях, нужны мощные машины и большие наборы обучающих данных. Такие ресурсы могут себе позволить только крупные корпорации. Еще есть стартапы — они в основном работают на арендованных мощностях и концентрируются на создании нейросети под конкретные задачи. Пример — знаменитое приложение Prisma. Отрасль может быть любой. Во всех сферах есть задачи, которые в силах решить нейросеть. Рассмотрим основные области задач, для решения которых используются нейросети. Классификация. Нейросеть получает объект и относит его к определенному классу. Самая первая сеть, перцептрон, решала именно задачи классификации, но очень простые. Сейчас возможности шире: сети могут классифицировать клиентов и выделять аудитории по интересам — вы сталкиваетесь с этой возможностью каждый день, когда ваш электронный почтовый ящик определяет (классифицирует) некоторые письма как спам. Но это не единственный пример: автоматический скоринг в банках, контекстная реклама — это все касается классификации. Распознавание. Задача поставлена иначе: она не в том, чтобы отнести объект к одному из классов, а в том, чтобы найти нужное среди множества данных — например, лицо на картинке. «Умные» фильтры для фотографий работают именно так. Можно вспомнить многочисленные нейросети, которые превращают фотографии в картины маслом или постеры, — они тоже сначала распознают, что находится на изображении. Распознавать можно и текстовые данные, например приложения для определения названия музыкальных треков. Но распознавание — это не только приложения. Это и поиск по картинке, и чтение текста с изображения, и работа «умных» камер слежения. Разнообразные программы для людей с ограниченными возможностями тоже используют возможности распознавания. Сюда же относятся голосовые ассистенты, которые распознают речь. Сейчас нейросети начинают активно применяться в медицине, например распознают информацию на снимках, что облегчает диагностику. Прогнозирование. Третий вариант — нейросети, которые получают входные данные и на их основе что-то предсказывают. Их часто применяют в аналитике, например в финансовом секторе такая сеть может предсказывать поведение рынка, а в маркетинге — тренды и аудитории. Нейросетевые программы, которые дописывают текст или дорисовывают изображение, тоже по сути занимаются прогнозированием. Так же работают поисковые системы: вы начинаете вводить фразу, а вам предлагают ее завершение. Это тоже задача прогнозирования, причем интересная — с учетом смысла предыдущих слов. Генерация. Нейронные сети могут сами генерировать контент. Пока он далек от идеального, но программы становятся умнее. Сейчас нейросети могут писать музыку, создавать изображения, и со временем они становятся все больше похожими на настоящие. Это комплексная задача, которая может состоять из нескольких предыдущих. Например, «дорисовка» человека на фотографии — задача распознавания и прогнозирования одновременно. Генерация текста в определенном стиле — классификация плюс прогнозирование.
В классическом программировании все очень упорядочено: разработчик пишет инструкцию, программа дает заданный результат. Например, можно указать, как выполняется расчет времени в пути, после чего программа будет делать это точно по конкретному алгоритму.
Биологические нейронные сети. Нервная система живого существа состоит из нейронов — клеток, которые накапливают и передают информацию в виде электрических и химических импульсов. У нейронов есть аксон — основная часть клетки, и дендрит — длинный отросток на ее конце, который может достигать сантиметра в длину. Дендриты передают информацию с одной клетки на другую и работают как «провода» для нервных импульсов. С помощью специальных шипов они цепляются за другие нейроны, и так сигналы передаются по всей нервной системе. В качестве примера можно привести любое осознанное действие. Например, человек решает поднять руку: импульс сначала появляется в его мозгу, потом через сеть нейронов информация передается от одной клетки к другой. По пути она преобразуется и в конечном итоге достигает клеток в руке. Рука поднимается. Так работает большинство процессов в организме — тех, которые управляются мозгом. Но главная особенность нейронных сетей — способность обучаться. И именно она легла в основу машинных нейросетей. Первые машинные нейросети. В сороковых годах прошлого века люди впервые попытались описать сеть нейронов математически. Затем, в пятидесятых, — воссоздать ее модель с помощью кода. Получилась та самая структура, которую назвали перцептрон. На графиках и иллюстрациях ее обычно рисуют как набор кругов и прямых, их соединяющих — это и есть нейроны, образующие сетку. Перцептрон был проще современных нейросетей. Он имел всего один слой и три типа элементов: первый тип принимал информацию, второй обрабатывал и создавал ассоциативные связи, третий выдавал результат. Но даже элементарная структура уже могла обучаться и более-менее точно решать простые задачи. Например, перцептрон мог ответить, есть ли на картинке предмет, который его научили распознавать. Он был способен отвечать только на вопросы, где есть два варианта ответов: «да» и «нет». После этого развитие нейросетей замедлилось. Существующих на тот момент технологий было недостаточно, чтобы создать мощную систему. Наработки шли неторопливо, но чем больше развивалась компьютерная отрасль, тем больше интереса вызывал концепт.
Нейросети применяются для создания визуального контента – это иконки, видеоролики, изображения. Дополнительно стоит выделить написание музыки и озвучку. Есть повышение качества картинок и управление основными параметрами: раскрашивание, черно-белый, редактирование с удалением предметов, дорисовка фона, объединение нескольких фото и другое. Помимо этого, сети умеют переносить в цифровое пространство все нарисованное от руки. Например, дизайнер сделал эскиз макета сайта на бумаге, достаточно сфотографировать его и преобразовать, используя потенциал нейронки.
Нейросети могут быть универсальными, например, ChatGPT и YandexGPT дают ответы на вопросы, ищут информацию, рисуют картинки, составляют бизнес-планы и решают другие задачи. В это же время Midjourney и Kandinsky ориентированы на отрисовку изображений, Codeium проверяет и дополняет код, а SteosVoice идеальна для озвучки. Помимо предназначения, классификация выполняется по типу архитектуры:
Современные нейронные сети. Когда компьютеры развились до современных мощностей, концепция нейронной сети снова стала привлекательной. К тому моменту ученые успели описать много алгоритмов, которые помогали распространять информацию по нейронам, и предложили несколько структур. Это были как однослойные, так и многослойные сети, однонаправленные и рекуррентные — подробнее мы расскажем о классификации далее. Чем более продвинутыми становились компьютеры, тем больше сложных и интересных задач могли реализовать нейронные сети. Мощность системы играет важную роль, т.к. каждый нейрон постоянно выполняет ресурсоемкие вычисления. Чтобы решить сложную задачу, обычно нужно много нейронов, их масштабная структура и множество математических функций. Понятно, что для этого понадобится очень сильный компьютер.