Как распознавать изображения нейросетью

0
17

Как понять, что картинку сделала нейросеть — 5 сервисов

Подборка сервисов

Внимание: все сервисы ниже могут дать только предположение о том, было сгенерировано изображение нейросетью или нет. Полагаться на них не стоит. И вообще в отношении синтетических изображений всегда будет существовать такая вот неоднозначность, ведь существуют очень реалистичные фотографии (такие часто принимаются за результат генерации) или изображения с комбинированными сценами (задник наложен в фотошопе, а человек — реальный).

Теперь придется подключить внимательность. Всем известна проблема, которая возникает у искусственного интеллекта с пальцами: нейросети никак не могут запомнить, сколько их должно быть у человека. Нередко на сгенерированных изображениях очки и другие аксессуары «сплавляются» с лицом человека, появляются посторонние руки в области талии, надписи становятся нечитаемыми, кожа приобретает странный матовый блеск. И порой у героев ИИ-фотосъемки слишком много зубов.

ИНС (искусственные нейросети) – это математическая модель функционирования традиционных для живых организмов нейросетей, которые представляют собой сети нервных клеток. Как и в биологическом аналоге, в искусственных сетях основным элементом выступают нейроны, соединенные между собой и образующие слои, число которых может быть разным в зависимости от сложности нейросети и ее назначения (решаемых задач).

Сервис умеет анализировать глаза, пальцы, другие детали, которые сразу выдают генерацию нейросети. Важно, что Hive AI Detector создал свою модель вообще с нуля и обучил ее более чем на миллионе реальных фотографий. По словам разработчика, Hive AI Detector умеет находить самые маленькие артефакты и несоответствия, которыми грешат популярные сегодня нейросети.

Действительно рабочих и качественных сервисов для распознавания сгенерированных нейросетями изображений крайне мало. Связано это в значительной степени с тем, что найти различия между генерацией последней версии, например, MidJourney и произведением цифрового художника очень сложно.

Сервис-детектор после непродолжительного анализа может сразу показать вероятность искусственного происхождения картинки: в виде однозначного ответа (да, сгенерировано нейросетью или нет), либо вероятность в процентах того, что это нейросетевое изображение. Сервисы для «детектирования» ИИ-картинок очень часто ошибаются. Тем не менее, они могут быть полезными, если, например, вам нужно проверять большие объемы картинок на ежедневной основе — например, если вы занимаетесь факт-чекингом.

Проверьте название, описание и комментарии

Удобно, что Hive AI Detector можно использовать не только путем загрузки изображения с жесткого диска. Вы можете задействовать сервис вообще на любом сайте — установите расширение для Google Chrome и затем сделайте правый клик по проверяемому изображению.

Нейросеть – это математическая модель в виде программного и аппаратного воплощения, строящаяся на принципах функционирования биологических нейросетей. Сегодня такие сети активно используют в практических целях за счет возможности не только разработки, но и обучения. Их применяют для прогнозирования, распознавания образов, машинного перевода, распознавания аудио и т.д.

Вердикт: в целом, хорошо — сервис выдал вероятность ИИ-генерации нашей фотографии шоколада лишь в 12,9%. Но были и ошибочные результаты — ИИ-изображения не были распознаны сервисом как таковые. Более того, у нас сложилось ощущение, что расширение выдает вероятность вообще случайным образом. И, тем не менее, разработчик заявляет о высокой точности — более 90%. Но на практике понятно: эта цифра сильно завышена.

Картинка разбивается на маленькие участки, вплоть до нескольких пикселей, каждый из которых будет входным нейроном. С помощью синапсов сигналы передаются от одного слоя к другому. Во время этого процесса сотни тысяч нейронов с миллионами параметров сравнивают полученные сигналы с уже обработанными данными.

ЧИТАТЬ ТАКЖЕ:  Нейросеть которая напишет код

Определить при помощи программ, является ли творчеством искусственного интеллекта текст, проще, чем распознать картинку. Поэтому инструментов для 5 инструментов для распознавания сгенерированного текста пока больше, чем визуальных детекторов. Зато у сгенерированных картинок есть особенности, которые начинают бросаться в глаза, стоит приобрести хотя бы небольшую насмотренность.

illuminarty.ai лучше всего определяет картинки, сгенерированные MidJourney, DALL-E, Stable Diffusion. Все потому, что illuminarty.ai использует конволюционную нейронную сеть (алгоритм, предназначенный для работы с изображениями, принимающий их в качестве входных данных), которая обучалась на миллионах изображений именно вышеуказанных сервисов.

About this image от Google

Если речь идет о картинках, то чаще всего нейросеть не справляется с руками (слишком много или мало пальцев, общие странности с анатомией), глазами (не анатомично растущие ресницы, глаза разного размера, нет бликов), волосами. ИИ-изображения очень реалистичны и детальны, но при этом «художник» допускает ошибки, которые не допустил бы и первокурсник художки.

HuggingFace — это сообщество людей, увлеченных машинным обучением. Ребята создают модели, датасеты и многое другое, причем по принципу Github: это именно комьюнити, где все делятся наработками и идеями. Их специализация — языковые модели-трансформеры, то есть та самая штука, которая лежит в основе ChatGPT. Но с изображениями они тоже работают — и даже представили первый инструмент , использующий мощности нейросетей для поиска следов ИИ в, на первый взгляд, невинной картинке.

Не все ИИ-художники делают вид, что рисовали картинку с нуля, и не все выдают себя за фотографов. ИИ-арт — вполне легитимное направление. Иногда ИИ-художники даже делятся промтом — запросом, позволившим им создать рисунок. А если очевидных указаний на инструмент нет, возможно, они найдутся в комментариях.

Вердикт: сервис правильно определил только некоторые ИИ-изображения. Многое было распознано некорректно. Есть куда совершенствоваться. Ложные срабатывания часто оказывались комбинированными фотографиями, скриншотами из игр, изображениями мемов. Это и понятно: в обучающую базу данных не входили изображения такого типа.

Обычной зачастую называют полносвязную нейронную сеть. В ней каждый узел (кроме входного и выходного) выступает как входом, так и выходом, образуя скрытый слой нейронов, и каждый нейрон следующего слоя соединён со всеми нейронами предыдущего. Входы подаются с весами, которые в процессе обучения настраиваются и не меняются в последствии. При этом у каждого нейрона имеется порог активации, после прохождения которого он принимает одно из двух возможных значений: -1 или 1, либо 0 или 1.

На сайте разработчика написано, что «illuminarty.ai использует передовое глубокое обучение для выявления изображений, сгенерированных искусственным интеллектом, и является одним из самых точных сервисов обнаружения ИИ-картинок на сегодняшний день». Весьма амбициозно! Скоро проверим.

Пожалуй, самая популярная задача нейросетей – распознавание визуальных образов. Сегодня создаются сети, в которых машины способны успешно распознавать символы на бумаге и банковских картах, подписи на официальных документах, детектировать объекты и т.д. Эти функции позволяют существенно облегчить труд человека, а также повысить надежность и точность различных рабочих процессов за счет отсутствия возможности допущения ошибки из-за человеческого фактора.

Работа с изображениями — важная сфера применения технологий Deep Learning. Глобально все изображения со всех камер мира составляют библиотеку неструктурированных данных. Задействовав нейросети, машинное обучение и искусственный интеллект, эти данные структурируют и используют для выполнения различных задач: бытовых, социальных, профессиональных и государственных, в частности, обеспечения безопасности.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь