Содержание статьи
Как определить текст, написанный нейросетью: 6 рабочих инструментов
AI Text Classifier
Никаких ограничений для пользователей Content at Scale нет, вы можете проверять бесплатно много разных текстов за один день практически без ограничений по количеству символов. Сама модель детекта тоже работает довольно быстро, поэтому весь процесс не займет много времени.
Что касается взаимодействия с самим анализатором текста, то этот процесс не станет чем-то трудным и будет понятен каждому пользователю. Единственное – незнающие английский язык могут использовать мою инструкцию ниже или же активировать встроенный в браузер переводчик страниц.
Результат проверки отображается по трем показателям — предсказуемость, вероятность и шаблонность. В правом окне отображаются фразы, которые предположительно созданы ботом. Желтая, оранжевая и красная заливки говорят о степени вероятности того, что текст написан с помощью инструментов искусственного интеллекта.
Сервис умеет анализировать глаза, пальцы, другие детали, которые сразу выдают генерацию нейросети. Важно, что Hive AI Detector создал свою модель вообще с нуля и обучил ее более чем на миллионе реальных фотографий. По словам разработчика, Hive AI Detector умеет находить самые маленькие артефакты и несоответствия, которыми грешат популярные сегодня нейросети.
Удобно, что Hive AI Detector можно использовать не только путем загрузки изображения с жесткого диска. Вы можете задействовать сервис вообще на любом сайте — установите расширение для Google Chrome и затем сделайте правый клик по проверяемому изображению.
illuminarty.ai лучше всего определяет картинки, сгенерированные MidJourney, DALL-E, Stable Diffusion. Все потому, что illuminarty.ai использует конволюционную нейронную сеть (алгоритм, предназначенный для работы с изображениями, принимающий их в качестве входных данных), которая обучалась на миллионах изображений именно вышеуказанных сервисов.
Онлайн-сервис GPTZero предоставляет стандартную функциональность для определения текста, написанного ИИ, а также помимо обычной вставки фрагментов поддерживает загрузку и анализ файлов, если символы превышают допустимое количество для вставки в форму проверки. Поддерживает модели нейронных сетей GPT3, GPT4, BARD и многие другие, которые сейчас пользуются популярностью. Давайте с вами на простом примере разберем процесс взаимодействия с данным веб-ресурсом.
В Контентим руководит отделом мультиязычного контента и умеет в условиях жестких дедлайнов собирать и обучать редакции на любых языках. Разрабатывает образовательные продукты для Контентим Education: запустила марафон по ChatGPT и дала буст в профессии более 1000 райтерам.
Writer
Удобен тем, что можно не только добавить текст, но и указать ссылку на него. Инструмент считывает контент со страницы сайта и выдает результат вероятности написания текста человеком или нейронной сетью. В бесплатной версии можно проверить до 1500 символов.
Мы проверили illuminarty.ai на фотографии шоколада и он… ошибся: вероятность ИИ 91%. Явно не тот результат, которого мы ждали. Но стоит отметить: сервис лучше определяет именно сгенерированные изображения, поэтому даже некоторые реальные фото он может «клеймить» как нейросетевые.
В качестве еще одного подходящего онлайн-сервиса могу порекомендовать AI Content Detector. Это стандартный по интерфейсу сайт, позволяющий одновременно проверить до трех тысяч слов. Отображает процент вероятности использования нейросети при написании проверяемого текста. Точно так же, как и многие подобные инструменты, не всегда корректно работает с русским текстом, но в большинстве случаев отображает правильный или приблизительный к нему результат, пропуская лишь некоторые фрагменты.
Внимание: все сервисы ниже могут дать только предположение о том, было сгенерировано изображение нейросетью или нет. Полагаться на них не стоит. И вообще в отношении синтетических изображений всегда будет существовать такая вот неоднозначность, ведь существуют очень реалистичные фотографии (такие часто принимаются за результат генерации) или изображения с комбинированными сценами (задник наложен в фотошопе, а человек — реальный).
С появлением нейронных сетей для генерирования текстов логично было ожидать, что вместе с ними появятся и сервисы, играющие роль детекторов. Существует множество полезных инструментов, анализирующих содержимое и определяющее вероятность, с которой текст мог быть создан ИИ. Есть разные критерии оценки, и каждый инструмент использует свой подход для качественного анализа. Поэтому отличным вариантом будет один и тот же фрагмент прогнать через несколько сайтов, чтобы получить объективный результат.
На сайте разработчика написано, что «illuminarty.ai использует передовое глубокое обучение для выявления изображений, сгенерированных искусственным интеллектом, и является одним из самых точных сервисов обнаружения ИИ-картинок на сегодняшний день». Весьма амбициозно! Скоро проверим.
Hive AI Detector
Сайт Text.ru позиционируется как биржа копирайтинга и имеет свой антиплагиат. С недавнего времени разработчики предлагают юзерам на платной основе доступ к рерайтеру текста на базе ИИ и детектору, который распознает такой написанный ботом текст. Это главный минус сайта, поскольку бесплатно нельзя проверить и несколько сотен символов, чтобы протестировать работу инструмента.
Вердикт: в целом, хорошо — сервис выдал вероятность ИИ-генерации нашей фотографии шоколада лишь в 12,9%. Но были и ошибочные результаты — ИИ-изображения не были распознаны сервисом как таковые. Более того, у нас сложилось ощущение, что расширение выдает вероятность вообще случайным образом. И, тем не менее, разработчик заявляет о высокой точности — более 90%. Но на практике понятно: эта цифра сильно завышена.
Но это лишь одна сторона медали. Кроме удобства и экономии ресурсов, технологии создают немало проблем. Вызывают недовольство авторов, чьи материалы алгоритмы используют в качестве источников. Подрывают доверие к студентам, копирайтерам, агентствам: появляются сомнения, что тексты писал человек.
Для проверки текста на искусственный интеллект используется комбинация алгоритмов машинного обучения и методов обработки естественного языка. Инструмент обучен изучать шаблоны и характеристики разных форм письма и может легко их обнаружить. В процентном соотношении показывает вероятность того, что текст сгенерирован нейросетью.
Первый на очереди сайт с названием AI Text Classifier, который как раз был создан OpenAI – разработчиком ChatGPT, поэтому инструмент первоочередно нужно использовать тем юзерам, кто хочет проверить, не был ли текст сгенерирован данным ИИ. Пока можно сказать, что сайт идеально определяет фрагменты текста на английском языке, а вот с распознанием других, особенно если информация компилируется из сборок открытых источников, пока не все так гладко. Впрочем, принцип действия AI Text Classifier и все дополнительные нюансы сразу описаны на главной странице, поэтому предлагаю сначала прочитать документацию, а затем переходить к работе с детектором.
Детектор umm-maybe был обучен на более чем 130 000 изображений. Работает он на основе конволюционной нейронной сети, которая специально подстроена под определение артефактов, характерных для ИИ-картинок. Компания-разработчик обещает: модель разработана таким образом, что со временем она будет совершенствоваться, по мере добавления новых обучающих данных и развития архитектуры модели.