Как искусственный интеллект распознает изображения

0
13

Распознавание изображений с помощью искусственного интеллекта Текст научной статьи по специальности «Компьютерные и информационные науки»

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Е В. Хроль, К С. Шаронова

Это свидетельствует о растущей популярности и востребованности данной технологии среди потребителей и компаний. Одним из ключевых трендов развития рынка биометрических технологий в России является переход от внутрикорпоративного использования биометрии к активному освоению клиентскими сервисами. Этот тренд наблюдается практически во всех сферах, начиная от транспорта и спортивных объектов, где биометрия интегрируется с системами видеонаблюдения и билетными кассами, и заканчивая банковским сектором и розничной торговлей, где биометрические

[6] Fang C., Aronov D., Abbott L. F., Mackevicius E. L. Neural learning rules for generating flexible predictions and computing the successor representation. Zuckerman Institute, Department of Neuroscience, Columbia University, United States; Basis Research Institute, United States https://doi.org/10.7554/eLife.80680

The article sets the task of considering the process of image recognition using convolutional neural networks. Image recognition is a key component of computer vision , which gives the system the ability to recognize and understand objects, places, people, language and behavior in digital images. Computer vision-enabled systems use data-driven image recognition algorithms to serve a wide range of applications. The paper analyzes the structure of the market for the use of the most common biometric technologies in various business areas in the domestic market, as well as a comparison with the world market. The task involves considering the difficulties that the machine faces when obtaining an image for processing, which can be tracked using learning curves . Learning curves are an excellent diagnostic tool for determining bias and variance in a controlled machine learning algorithm. Therefore, understanding the nature of errors in training artificial intelligence in the process of image recognition is necessary knowledge in the modern world, as it helps to avoid the stage of repeated retraining of the sample.

В статье ставится задача рассмотрения процесса распознавания изображений с помощью сверточных нейронных сетей. Распознавание изображений — это ключевой компонент компьютерного зрения , который наделяет систему способностью распознавать и понимать объекты, места, людей, язык и поведение на цифровых изображениях. Системы с поддержкой компьютерного зрения используют алгоритмы распознавания изображений на основе данных для обслуживания широкого спектра приложений. В работе проведен анализ структуры рынка применения самых распространённых биометрических технологий в разных сферах бизнеса на отечественном рынке, а также сравнение с мировым рынком. Задача включает в себя рассмотрения сложностей, с которыми сталкивается машина при получении изображения для обработки, которые возможно отследить с помощью кривых обучения . Кривые обучения отличный диагностический инструмент для определения смещения и дисперсии в контролируемом алгоритме машинного обучения . Поэтому понимание природы ошибок в обучении искусственного интеллекта в процессе распознавания изображений является необходимым знанием в современном мир, так как оно помогает избежать этапа повторного переобучения выборки.

В современном мире распознавание изображений нашло широкое применение в сфере информационных технологий, причем не только в управлении сложными машинными комплексами, но и в различных сферах бизнеса. Данное решение используется как при верификации личности пользователя с помощью отпечатка пальца, так и при поиске изображений в поисковых системах.

Третья модель — случайный лес. Модель хорошей подгонки существует в серой зоне между моделями недостаточной и избыточной подгонки. Модель, может быть, не так хороша для обучающих данных, как в экземпляре overfit, но она будет допускать гораздо меньше ошибок при работе с невидимыми экземплярами. Такое поведение можно наблюдать, когда ошибка обучения возрастает, но только до точки стабильности, по мере уменьшения ошибки проверки до точки стабильности. [7]

ЧИТАТЬ ТАКЖЕ:  Что такое знания в системах искусственного интеллекта

Image recognition using artificial intelligence

Модель допускает очень мало ошибок, когда требуется предсказать экземпляры, которые она видит во время обучения, но ужасно работает на новых экземплярах, с которыми она не сталкивалась. Вы можете наблюдать за этим поведением, замечая, насколько велика ошибка обобщения между кривой обучения и кривой проверки. Решением для улучшения этого поведения может быть добавление большего количества экземпляров в наш обучающий набор данных, что приводит к смещению. Другим решением может быть добавление регуляризации в модель (т. Е. ограничение роста дерева на всю глубину). [7]

Нейросеть – это математическая модель в виде программного и аппаратного воплощения, строящаяся на принципах функционирования биологических нейросетей. Сегодня такие сети активно используют в практических целях за счет возможности не только разработки, но и обучения. Их применяют для прогнозирования, распознавания образов, машинного перевода, распознавания аудио и т.д.

[6] Fang C., Aronov D., Abbott L. F., Mackevicius E. L. Neural learning rules for generating flexible predictions and computing the successor representation. Zuckerman Institute, Department of Neuroscience, Columbia University, United States; Basis Research Institute, United States. https://doi.org/10.7554/eLife.80680

Мы можем сделать вывод, что кривая обучения полезный инструмент, который позволяет избежать неграмотного обучения искусственного интеллекта. Вышеуказанные модели позволяют понять в каком именно аспекте обучения разработчики двигаются неправильно. Направление машинного обучения и искусственного интеллекта в настоящем времени является одной из самых бурно исследуемых направлений использования информационных технологий, поэтому данное исследование является важным для развития технологии компьютерного зрения не только в узконаправленных отраслях, но в простых задачах бизнеса.

Abstract. The article sets the task of considering the process of image recognition using convolutional neural networks. Image recognition is a key component of computer vision, which gives the system the ability to recognize and understand objects, places, people, language and behavior in digital images. Computer vision-enabled systems use data-driven image recognition algorithms to serve a wide range of applications. The paper analyzes the structure of the market for the use of the most common biometric technologies in various business areas in the domestic market, as well as a comparison with the world market. The task involves considering the difficulties that the machine faces when obtaining an image for processing, which can be tracked using learning curves. Learning curves are an excellent diagnostic tool for determining bias and variance in a controlled machine learning algorithm. Therefore, understanding the nature of errors in training artificial intelligence in the process of image recognition is necessary knowledge in the modern world, as it helps to avoid the stage of repeated retraining of the sample.

[4] Прокопеня А. С., Азаров И. С. Современные методы распознавания изображений. BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник материалов V Международной научно-практической конференции, Минск, 13-14 марта 2019 г. В 2 ч. Ч. 1. Белорусский государственный университет информатики и радиоэлектроники; редкол.: В. А. Богуш [и др.]. Минск; 2019. С. 351 — 359.

ИНС (искусственные нейросети) – это математическая модель функционирования традиционных для живых организмов нейросетей, которые представляют собой сети нервных клеток. Как и в биологическом аналоге, в искусственных сетях основным элементом выступают нейроны, соединенные между собой и образующие слои, число которых может быть разным в зависимости от сложности нейросети и ее назначения (решаемых задач).

Рисунок 5. Модель случайный лес. Figure 5. Random forest model. Теперь вы можете видеть, что мы уменьшили ошибку в данных проверки. Это произошло за счет снижения производительности обучающих данных, но в целом это лучшая модель. Ошибка обобщения намного меньше, при этом совершается небольшое количество ошибок. Кроме того, обе кривые стабильны при размере обучающего набора более 250, что подразумевает, что добавление дополнительных экземпляров может не привести к дальнейшему улучшению этой модели. [8]

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь