Что такое глубокое обучение искусственного интеллекта

0
14

ГЛУБОКОЕ ОБУЧЕНИЕ: ОПРЕДЕЛЕНИЕ И ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

Распознавание именованных сущностей

Подразумевает использование помеченных наборов данных (обучение с учителем): каждая строка в наборе содержит целевой признак (метку), позволяющей однозначно отнести первую к определенному классу. Зная корреляции между входными данными и меткой, можно обучить нейронную сеть. Это позволяет решить такие практические задачи, как: распознавание лиц (идентификация людей на изображениях, определение выражения лица); идентификация объектов на изображениях; распознавание жестов в видеопоследовательности; идентификация человека по голосу; преобразование речи в текст; фильтрация спама и т.д.

Annotation: Artificial intelligence, machine learning, deep learning are words that many know. However, not everyone can clearly articulate the differences between these terms. The ambiguity of interpretations gives rise to confusion. Therefore, it seems justified to characterize each of the elements. This paper contains information about all three of the aforementioned technologies, with the emphasis on the latter, because it is the most relevant at the present time.

Сверточная нейронная сеть — это особо эффективная искусственная нейронная сеть, имеющая уникальную архитектуру. Слои в ней организованы в трех измерениях: ширина, высота и глубина. Нейроны в одном слое соединяются не со всеми нейронами в следующем слое, а только с небольшой областью нейронов этого слоя. Окончательный результат сокращается до одного вектора оценки вероятности, упорядоченного по глубине в одном из измерений.

Нейронная сеть с передачей по очереди — это наиболее простой тип искусственной нейронной сети. В сети с передачей по очереди информация перемещается только в одном направлении от входного уровня к выходному. Нейронные сети с передачей по очереди преобразуют входные данные, пропуская их через несколько скрытых слоев. Каждый слой состоит из набора нейронов и полностью соединен со всеми нейронами в предыдущем слое. Последний полностью соединенный слой (выходной слой) представляет собой вывод созданных прогнозов.

Таким образом, вместо «вручную» написанных программ с заданным набором инструкций для выполнения конкретной задачи, машина «обучается» с использованием больших объемов данных и алгоритмов, которые дают ей возможность научиться выполнять специфическую задачу.

данных был использован для обучения алгоритма, тем точнее он будет работать. Следовательно, указанный тип обучения способен создавать эффективные модели. Это позволяет решить такие практические задачи, как: сравнение документов, изображений, звуков или каких-либо прочих объектов; обнаружение аномалий и т.д.

Аналитика текста

Обучение моделей глубокого обучения часто требует большого количества обучающих данных, наличия ресурсов для высокопроизводительных вычислений (GPU, TPU) и временных затрат. В случаях, когда доступ к таким ресурсам отсутствует, можно попытаться упростить процесс обучения с помощью методики, известной как перенос обучения.

Например, когда программа Google DeepMind AlphaGo победила южнокорейского мастера Ли Седоля в игре го (2016 год) [5], средства массовой информации использовали термины AI (ИИ, искусственный интеллект), машинное обучение и глубокое обучение, чтобы описать, как победил DeepMind. И все три являются одной из причин выигрыша AlphaGo. Но это не одно и то же.

ЧИТАТЬ ТАКЖЕ:  Как написать искусственный интеллект c

Структура нейронных сетей такова, что первый набор слоев обычно содержит признаки более низкого уровня, а последний — признаки более высокого уровня, которые нас интересуют. Используя последние слои применительно к новой задаче или области рассмотрения, можно значительно сократить количество времени, данных и вычислительных ресурсов, необходимых для обучения новой модели. Например, у вас имеется модель, которая распознает легковые автомобили, можно переориентировать эту модель путем переноса обучения, чтобы начать распознавать грузовики, мотоциклы и другие виды транспортных средств.

Таким образом, глубокое обучение является направлением в области машинного обучения, предназначенным для решения достаточно широкого круга задач. Алгоритмы глубокого обучения могут автоматически, без участия человека, обнаруживать закономерности в больших неструктурированных и немаркированных объемах данных, что отличает их от большинства традиционных алгоритмов машинного обучения. Указанный тип обучения позволяет обойти временные ограничения и расширить возможности небольших групп исследователей при обработке немасштабируемых данных. При использовании «классических» подходов могут потребовать годы на решение упомянутой задачи.

Одним из аспектов, который отделяет машинное обучение от классических методов искусственного интеллекта, является его способность самомодификации, опирающаяся на обработку больших объемов данных; то есть машинное обучение динамично и не требует вмешательства человека для внесения определенных изменений. Это позволяет в заметной степени избавиться от субъективизма людей-экспертов.

Базовые модели в Машинное обучение Azure — это предварительно обученные модели глубокого обучения, которые можно точно настроить для конкретных вариантов использования. Дополнительные сведения о моделях Foundation (предварительная версия) см. в Машинное обучение Azure и использовании базовых моделей в Машинное обучение Azure (предварительная версия).

Генеративно-состязательные сети — это регенеративные модели, обученные для создания реалистичного содержимого, например изображений. Каждая такая сеть состоит из двух сетей, известных как генератор и дискриминатор. Обе сети обучаются одновременно. Во время обучения генератор использует случайные помехи для создания новых искусственных данных, которые похожи на реальные данные. Дискриминатор принимает выходные данные генератора в качестве входных данных и использует реальные данные, чтобы определить, является ли созданное содержимое реальным или искусственным. Каждая из сетей конкурирует друг с другом. Генератор пытается создать искусственное содержимое, которое не отличается от реального содержимого, в то время как дискриминатор пытается правильно классифицировать входные данные либо как реальные, либо как искусственные. Затем выходные данные используются для обновления веса обеих сетей, чтобы помочь им лучше достичь соответствующих целей.

С помощью соответствующего преобразования данных нейронная сеть может понимать текст, звук и визуальные сигналы. Машинный перевод можно использовать для распознавания фрагментов звука в больших звуковых файлах и преобразовывать устную речь или изображения в текст.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь