Содержание статьи
Введение в глубокое обучение
В этом разделе
Задачи глубокого обучения на выявление изменений могут обнаружить изменения в интересующих объектах в промежутке между двумя датами и создать логическую карту изменений. Например, изображение слева внизу показывает строительство жилья пять лет назад, изображение посередине показывает это же строительство сейчас, а изображение справа показывает логическую карту изменений, где новые дома отображены белым.
Нейронная сеть с передачей по очереди — это наиболее простой тип искусственной нейронной сети. В сети с передачей по очереди информация перемещается только в одном направлении от входного уровня к выходному. Нейронные сети с передачей по очереди преобразуют входные данные, пропуская их через несколько скрытых слоев. Каждый слой состоит из набора нейронов и полностью соединен со всеми нейронами в предыдущем слое. Последний полностью соединенный слой (выходной слой) представляет собой вывод созданных прогнозов.
Существует множество задач компьютерного зрения, которые можно решить с помощью нейронных сетей глубокого обучения. Esri разработала инструменты, которые позволяют выполнять классификацию изображений, обнаружение объектов, семантическую сегментацию и сегментацию экземпляров. Все эти задачи компьютерного зрения описаны ниже с примерами дистанционного зондирования и более общим примером компьютерного зрения.
Сверточная нейронная сеть — это особо эффективная искусственная нейронная сеть, имеющая уникальную архитектуру. Слои в ней организованы в трех измерениях: ширина, высота и глубина. Нейроны в одном слое соединяются не со всеми нейронами в следующем слое, а только с небольшой областью нейронов этого слоя. Окончательный результат сокращается до одного вектора оценки вероятности, упорядоченного по глубине в одном из измерений.
Глубокое обучение – это разновидность машинного обучения, которая использует несколько уровней алгоритмов в виде нейронных сетей. Входные данные анализируются через различные слои сети, причем каждый слой определяет конкретные характеристики и закономерности в этих данных. Например, если вы хотите идентифицировать такие объекты, как здания и дороги, модель глубокого обучения может обучаться с помощью изображений различных зданий и дорог, обрабатывая эти изображения через слои внутри нейронной сети, а затем находя идентификаторы, необходимые для классификации здания или дороги.
Компании используют глубокое обучение для анализа текста, чтобы обнаруживать торговлю инсайдерской информацией и обеспечивать соответствие требованиям законодательства. Еще один распространенный пример — мошенничество в области страхования: машинный анализ текста часто используется для анализа больших объемов документов, чтобы распознать случаи возможного мошенничества, выдаваемые за страховой случай.
Распознавание именованных сущностей
Структура нейронных сетей такова, что первый набор слоев обычно содержит признаки более низкого уровня, а последний — признаки более высокого уровня, которые нас интересуют. Используя последние слои применительно к новой задаче или области рассмотрения, можно значительно сократить количество времени, данных и вычислительных ресурсов, необходимых для обучения новой модели. Например, у вас имеется модель, которая распознает легковые автомобили, можно переориентировать эту модель путем переноса обучения, чтобы начать распознавать грузовики, мотоциклы и другие виды транспортных средств.
Генеративно-состязательные сети — это регенеративные модели, обученные для создания реалистичного содержимого, например изображений. Каждая такая сеть состоит из двух сетей, известных как генератор и дискриминатор. Обе сети обучаются одновременно. Во время обучения генератор использует случайные помехи для создания новых искусственных данных, которые похожи на реальные данные. Дискриминатор принимает выходные данные генератора в качестве входных данных и использует реальные данные, чтобы определить, является ли созданное содержимое реальным или искусственным. Каждая из сетей конкурирует друг с другом. Генератор пытается создать искусственное содержимое, которое не отличается от реального содержимого, в то время как дискриминатор пытается правильно классифицировать входные данные либо как реальные, либо как искусственные. Затем выходные данные используются для обновления веса обеих сетей, чтобы помочь им лучше достичь соответствующих целей.
Как и при распознавании изображений, при создании заголовков изображений система должна создать заголовок, описывающий содержание конкретного изображения. Если у вас имеется технология, позволяющая обнаруживать и помечать объекты на фотографиях, следующим шагом станет преобразование этих меток в описательные предложения.
Теперь, когда получены общие сведения о машинном обучении и глубоком обучении, давайте сравним эти два метода. При машинном обучении алгоритму необходимо сообщить, как выполнять точный прогноз, используя дополнительные сведения (например, путем получения данных). В случае глубокого обучения алгоритм сможет обучиться, как создавать точный прогноз путем самостоятельной обработки данных с помощью структуры искусственных нейронных сетей.
Инструменты машинного обучения уже несколько десятилетий являются основным компонентом пространственного анализа в ГИС. Вы могли использовать машинное обучение в ArcGIS для выполнения классификации изображений, обогащения данных кластеризацией и моделирования пространственных отношений. Машинное обучение – это раздел искусственного интеллекта, в котором структурированные данные обрабатываются с помощью алгоритма для решения задачи. Традиционные структурированные данные требуют, чтобы пользователь помечал данные, например, изображения кошек и собак, чтобы алгоритм понимал характерные признаки каждого типа животных и мог их использовать для автоматической идентификации животных на других изображениях.
Рекуррентные нейронные сети — это широко используемые искусственные нейронные сети. Эти сети сохраняют выходные данные слоя и передают его обратно на входной слой, чтобы улучшить прогнозирование на выходе конкретного слоя. У рекуррентных нейронных сетей отличные возможности для обучения. Они широко используются для выполнения сложных задач, таких как прогнозирование временных рядов, обучение распознаванию рукописного ввода и распознавание естественной речи.
Глубокое обучение зачастую применяется для обнаружения объектов. Обнаружение объектов используется для идентификации объектов на изображении (например, автомобилей или людей) и предоставления определенного расположения для каждого объекта с ограничивающим полем.
Благодаря структуре искусственной нейронной сети глубокое обучение прекрасно справляется с поиском закономерностей в неструктурированных данных, таких как изображения, звук, видео и текст. По этой причине глубокое обучение ведет к быстрым преобразованиям в различных отраслях, включая здравоохранение, электроэнергетику, финансы и транспорт. Эти отрасли теперь реорганизуют традиционные бизнес-процессы.