Содержание статьи
Обнаружение лиц и распознавание лиц
Как нейросети распознают лица?
Определение лиц используется для ряда целей. Как указано выше, это первый необходимый шаг в любом приложении, использующем распознавание лиц. Без обнаружения не может быть никакого распознавания. Само распознавание лица оказалось очень полезным в таких областях, как автоматическое управление доступом и коммуникация компьютерного зрения.
В июне 2023 года Европарламент предварительно одобрил законопроект о регулировании ИИ — с предложением запретить онлайн-системы распознавания лиц в общественных местах. Кроме того, под запрет подпадают и механизмы распознавания эмоций. Если закон утвердят, их нельзя будет применять работодателям, устанавливать в полиции и в учебных заведениях. Теперь проект обсуждается с Еврокомиссией, далее его передадут в Совет ЕС.
Одна конкретная опорная точка, моргающие глаза. Если программное обеспечение может определить два глаза которые расположены симметрично и при этом моргают, то это признак того, что в этой области есть лицо. Далее программное обеспечение может определить область видеоизображения, которое на самом деле является лицом, используя одну из нескольких моделей лиц.
Маркетологи нашли реальную выгоду от большей части аналитики в реальном времени в таких областях, как распознавание пола и возраста. Это позволило им изменить свои стенды для привлечения людей, находящихся поблизости. Они также могут оценить интерес потребителей благодаря обнаружению выражений лица (счастливые, удивленные, сердитые или грустные выражения лица).
Существует простой метод, когда можно использовать изображение лица на простом фоне. В этом случае программное обеспечение может легко удалить фон, оставив границы лица. Если программное обеспечение использует такой подход, то возможны несколько разных классификаторов для обнаружения различных типов лицевых поверхностей, а также для профилей. Он будет пытаться обнаружить глаза, нос, рот, а в некоторых случаях все тело в фотографиях где оно есть.
Проще говоря, компьютер, пытающийся определить лицо, начнется с изучения неподвижной фотографии или видеоизображения. Затем возникает задача определить, есть ли какие-либо грани, присутствующие в этом изображении, отличая эти лица от всего, что еще находится в фоновом режиме. Он должен делать это независимо от освещения, ориентации или расстояния камеры.
При использовании видеоизображения, вы можете использовать движение. Лица людей движутся в режиме реального времени, поэтому один из вариантов — это программное обеспечение для захвата движущейся области. Другие части видео также перемещаются, поэтому программное обеспечение должно искать конкретные опорные точки, чтобы указать движущееся лицо.
Технологии распознавания лиц полезны в сфере безопасности, для предотвращения и расследования преступлений, в медицине, маркетинге. Важно: использовать такие системы необходимо с учетом действующего законодательства в отношении конфиденциальности и приватности личных данных.
Сферы применения
Для повышения точности распознавания и уменьшения ошибок могут быть добавлены дополнительные шаги. Например, тренировочный набор данных с изменением угла съемки, освещения, с добавленными шумами. Также алгоритмы должны регулярно тестироваться и обновляться.
Как упоминалось выше, обнаружение лиц — это процесс, который необходимо пройти, чтобы определить, действительно ли на фото или видео есть одно или несколько лиц. Он не определяет, чьи лица находятся на картинке. Поэтому обнаружение лица само по себе не запоминает и не хранит детали лиц. Если программное обеспечение обнаружит лицо определенного человека на одном снимке, а затем обнаружит это же лицо на другом снимке, оно не определит, что это одно и тоже лицо — она только определит, что на каждом снимке есть лицо.
Цель программного обеспечения распознавания лиц – идентифицировать лица на фото или видеоизображении путем сравнения с ранее существовавшей базой лиц. Для успешного распознавания, лица должны быть занесены в базу данных программы. На данном этапе программное обеспечение определит уникальные элементы для идентификации лица, которые она сохранит в базе данных. Позже, когда программа будет распознавать изображения людей, будут сравниваться уникальные элементы и, если она найдет совпадение, при высокой вероятности, она распознает это лицо на картинке.
Обнаружение лиц — это метод, который используется, когда программное обеспечение определяет местоположение и размера человеческого лица на определенной фотографии или видео. Программное обеспечение на сегодняшний день достаточно умное, чтобы обнаружить черты лица, в то же время игнорируя другие объекты, такие как здания, тела и другие объекты.
Термины обнаружения лиц и распознавания лиц, как правило, используются неправильно, особенно средствами массовой информации, которые часто не проводят различия между этими двумя действиями. Реальность такова, что они разные, хотя для распознавания лиц необходимо сначала обнаружить лицо.
Это упрощенный метод, который компьютер может использовать для поиска лиц. Для использования фотографий или видеоизображений требуется цвет, поэтому программное обеспечение сканирует изображение, которое ищет области, где имеется типичный цвет кожи, а затем ищет сегменты лица. Проблема с этим методом заключается в том, что цвет кожи может быть разным и такой метод не подходит для всех цветов кожи. Изменение освещения изменяет оттенок кожи человека на изображении, и это может также оказать существенное влияние на поиск лиц.
Технология распознавания лиц (биометрическая идентификация) — это процесс идентификации искусственным интеллектом личности человека на основе физических характеристик: формы лица, структуры костей, черт и пропорций, морщин, родинок. Самый простой пример — система Face ID на iPhone. Камера TrueDepth на передней стороне телефона используется, чтобы отсканировать лицо пользователя и создать 3D-модель. Затем система выявляет особенности, такие как форма глаз, носа и т. д., формирует уникальный шаблон лица и сохраняет его в защищенном облачном хранилище. Когда пользователь включает iPhone, Face ID сканирует его лицо и сравнивает с сохраненным шаблоном с помощью алгоритма машинного обучения. Если соответствие подтверждено, то iPhone разблокируется. Для повышения качества работы Face ID применяет нейронную сеть глубокого обучения. Система непрерывно учится и обновляется на основе новых данных, чтобы выдавать более точные результаты.
Для распознавания лиц ИИ использует методы глубокого обучения (deep learning). В глубоком обучении искусственные нейронные сети применяются для моделирования высокоуровневых абстракций данных. Они получают изображения с высоким разрешением, обрабатывают их и на выходе выводят данные, соответствующие сигнатуре лица, для сравнения и распознавания в реальном времени.