Содержание статьи
В чем разница между ИИ и машинным обучением и почему это важно
Варианты использования машинного обучения
Благодаря структуре искусственной нейронной сети глубокое обучение прекрасно справляется с поиском закономерностей в неструктурированных данных, таких как изображения, звук, видео и текст. По этой причине глубокое обучение ведет к быстрым преобразованиям в различных отраслях, включая здравоохранение, электроэнергетику, финансы и транспорт. Эти отрасли теперь реорганизуют традиционные бизнес-процессы.
Из определений видно, что машинное обучение является подмножеством, одним из компонентов искусственного интеллекта, то есть они отличаются, но при этом тесно связаны. ИИ — более широкое понятие, которое определяет способность компьютерной системы думать, рассуждать и действовать как человек. В то же время МО — одно из направлений ИИ, позволяющее компьютерной системе обучаться на данных и принимать решения, основанные на результатах обучения. Помимо МО в понятие ИИ входит также глубокое обучение (Deep Learning), робототехника, обработка естественного языка (NLP) и другие направления.
Распознавание именованных сущностей — это метод глубокого обучения, который воспринимает фрагмент текста в качестве входных данных и преобразует его в предварительно определенный класс. Эта новая информация может быть почтовым индексом, датой или кодом продукта. Затем эти сведения можно хранить в структурированной схеме для создания списка адресов или служить эталоном для подсистемы проверки кода.
Структура нейронных сетей такова, что первый набор слоев обычно содержит признаки более низкого уровня, а последний — признаки более высокого уровня, которые нас интересуют. Используя последние слои применительно к новой задаче или области рассмотрения, можно значительно сократить количество времени, данных и вычислительных ресурсов, необходимых для обучения новой модели. Например, у вас имеется модель, которая распознает легковые автомобили, можно переориентировать эту модель путем переноса обучения, чтобы начать распознавать грузовики, мотоциклы и другие виды транспортных средств.
Преобразователи — это архитектура модели, которая подходит для решения проблем, содержащих такие последовательности, как текст или данные временных рядов. Они состоят из слоев кодировщика и декодера. Кодировщик принимает входные данные и сопоставляет их с числовым представлением, содержащим определенные сведения, например контекст. Декодер использует информацию из кодировщика для получения выходных данных, например переведенного текста. Преобразователи отличаются от других архитектур, содержащих кодировщики и декодеры, своими вложенными слоями внимания. Внимание: метод концентрации на конкретных частях входных данных на основе важности их контекста относительно других входных данных в последовательности. Например, при суммировании новостных статей не все предложения важны для описания основной идеи. Если сосредоточиться на ключевых словах в статье, формирование сводных данных может быть сделано в одном предложении — в заголовке.
Искусственный интеллект (ИИ) — это специализированное программное обеспечение, которое для выполнения сложных задач имитирует когнитивные способности человека, а именно его способность обучаться, рассуждать и анализировать информацию. ИИ, как и человек, может принимать решения, делать переводы текстов, анализировать исторические данные и многое другое, на что ранее было способно только человеческое мышление. Другими словами, искусственным интеллектом можно назвать набор программных инструментов, которые заставляют вычислительные машины вести себя разумно как человек.
Глубокое обучение, машинное обучение и искусственный интеллект
Теперь, когда получены общие сведения о машинном обучении и глубоком обучении, давайте сравним эти два метода. При машинном обучении алгоритму необходимо сообщить, как выполнять точный прогноз, используя дополнительные сведения (например, путем получения данных). В случае глубокого обучения алгоритм сможет обучиться, как создавать точный прогноз путем самостоятельной обработки данных с помощью структуры искусственных нейронных сетей.
Сверточная нейронная сеть — это особо эффективная искусственная нейронная сеть, имеющая уникальную архитектуру. Слои в ней организованы в трех измерениях: ширина, высота и глубина. Нейроны в одном слое соединяются не со всеми нейронами в следующем слое, а только с небольшой областью нейронов этого слоя. Окончательный результат сокращается до одного вектора оценки вероятности, упорядоченного по глубине в одном из измерений.
Как и при распознавании изображений, при создании заголовков изображений система должна создать заголовок, описывающий содержание конкретного изображения. Если у вас имеется технология, позволяющая обнаруживать и помечать объекты на фотографиях, следующим шагом станет преобразование этих меток в описательные предложения.
В 1959 году Артур Сэмюэл придумал термин «машинное обучение» — способность компьютера учиться без участия человека. То есть искусственный интеллект возможен без машинного обучения, но для этого понадобится миллион строк кода со сложными правилами и условиями.
Основное отличие заключается в том, что машинное обучение никаким образом не имитирует человеческий интеллект, а занимается выявлением закономерностей в данных. У МО более узкая, специфичная сфера применения: создание прогнозных моделей, в то время как у ИИ гораздо больше возможностей для использования в решении самых разных задач.
Во многих случаях программе машинного обучения предоставляют много входных данных (например, изображений, текстов, сообщений), в которых она находит общие паттерны и выявляет закономерности. Такой метод машинного обучения называется «обучение с учителем». Существуют и другие подходы: «обучение с частичным участием учителя», «обучение без учителя» (оно же «обучение без присмотра») и «обучение с подкреплением».
Нейронная сеть с передачей по очереди
Полина Кабирова, коммерческий автор и переводчик, специально для блога Нетологии перевела статью Калума Макклилланда о том, чем отличаются искусственный интеллект, машинное и глубокое обучение и как интернет вещей и искусственный интеллект влияют друг на друга.
Некоторые из наиболее распространенных применений глубокого обучения проводятся в следующих абзацах. В Машинное обучение Azure можно использовать модель, созданную из платформы с открытым исходным кодом, или создать модель с помощью предоставленных средств.
Генеративно-состязательные сети — это регенеративные модели, обученные для создания реалистичного содержимого, например изображений. Каждая такая сеть состоит из двух сетей, известных как генератор и дискриминатор. Обе сети обучаются одновременно. Во время обучения генератор использует случайные помехи для создания новых искусственных данных, которые похожи на реальные данные. Дискриминатор принимает выходные данные генератора в качестве входных данных и использует реальные данные, чтобы определить, является ли созданное содержимое реальным или искусственным. Каждая из сетей конкурирует друг с другом. Генератор пытается создать искусственное содержимое, которое не отличается от реального содержимого, в то время как дискриминатор пытается правильно классифицировать входные данные либо как реальные, либо как искусственные. Затем выходные данные используются для обновления веса обеих сетей, чтобы помочь им лучше достичь соответствующих целей.
В этой статье сравнивается глубокое обучение и машинное обучение, а также описывается, как эти технологии соотносятся с более широким понятием искусственного интеллекта. Узнайте о решениях для глубокого обучения, которые можно создавать с помощью Машинного обучения Azure, предназначенных для обнаружения мошенничества, распознавания речи и лиц, анализа тональности и прогнозирования временных рядов.
Машинный перевод воспринимает слова или предложения на одном языке и автоматически переводит их на другой язык. Машинный перевод существует уже давно, однако сейчас глубокое обучение позволяет получать впечатляющие результаты в двух конкретных областях: автоматический перевод текста (и перевод речи в текст), а также автоматическое преобразование изображений.
Машинное обучение (МО) — это разновидность искусственного интеллекта, которая использует результаты обучения на наборах данных для создания моделей, способных выполнять сложные задачи. Вместо программирования МО использует алгоритмы, чтобы анализировать данные, обучаться на них и принимать обоснованные решения. По мере обучения и увеличения количества данных алгоритмы становятся все более точными, то есть чем больше данных будет использовано в процессе, тем лучше и эффективнее будет модель.
Обучение моделей глубокого обучения часто требует большого количества обучающих данных, наличия ресурсов для высокопроизводительных вычислений (GPU, TPU) и временных затрат. В случаях, когда доступ к таким ресурсам отсутствует, можно попытаться упростить процесс обучения с помощью методики, известной как перенос обучения.
Технология адаптируется сама и не требует вмешательства человека. Не надо нажимать на кнопки, набирать текст, искать информацию — только сообщить, что нужно. Например, узнать прогноз погоды или подготовить дом ко сну — выключить кондиционер, закрыть двери, погасить свет.