Содержание статьи
Как определить текст, написанный нейросетью: 6 рабочих инструментов
Content at Scale
Стоит понимать, что подобные сайты созданы не так давно и пока только находятся на стадии обучения и улучшения функциональности. Поэтому не всегда получается на 100% точно определить происхождение текста. Нивелируется в некоторых случаях это одновременным использованием нескольких разных сервисов, которые вы можете выбрать для себя из описаний выше.
Онлайн-сервис GPTZero предоставляет стандартную функциональность для определения текста, написанного ИИ, а также помимо обычной вставки фрагментов поддерживает загрузку и анализ файлов, если символы превышают допустимое количество для вставки в форму проверки. Поддерживает модели нейронных сетей GPT3, GPT4, BARD и многие другие, которые сейчас пользуются популярностью. Давайте с вами на простом примере разберем процесс взаимодействия с данным веб-ресурсом.
ChatGPT — это вариант победить врага его же оружием. Скиньте самой продвинутой нейросети кусок текста и спросите, написал ли его ИИ . Учитывая, что ChatGPT запоминает предыдущие сообщения и остается в контексте диалога, задайте дополнительные вопросы, как чат-бот пришел к своему выводу.
При этом новая версия языковой модели гораздо лучше работает с контекстом, чем ее предшественники. Поэтому теоретически уже после генерации можно попросить ChatGPT подредактировать текст и сделать его «более человеческим». Но от этого он не станет выглядеть полностью живым. Добиться хорошего результата можно, только если редактурой займется человек.
Нейросеть пишет большинство текстов по одинаковой структуре. Обычно они состоят из вступления, основной части и вывода. Во вступлении нейросеть представляет тему, дает общий контекст. Основная часть текста состоит из нескольких абзацев, каждый раскрывает отдельный аспект темы. Но переходы могут быть нелогичными, а связь между абзацами — не очень четкой. В заключении нейросеть старается подвести итог, сделать выводы из сказанного. Но они общие и предсказуемые.
Сайт Text.ru позиционируется как биржа копирайтинга и имеет свой антиплагиат. С недавнего времени разработчики предлагают юзерам на платной основе доступ к рерайтеру текста на базе ИИ и детектору, который распознает такой написанный ботом текст. Это главный минус сайта, поскольку бесплатно нельзя проверить и несколько сотен символов, чтобы протестировать работу инструмента.
В качестве еще одного подходящего онлайн-сервиса могу порекомендовать AI Content Detector. Это стандартный по интерфейсу сайт, позволяющий одновременно проверить до трех тысяч слов. Отображает процент вероятности использования нейросети при написании проверяемого текста. Точно так же, как и многие подобные инструменты, не всегда корректно работает с русским текстом, но в большинстве случаев отображает правильный или приблизительный к нему результат, пропуская лишь некоторые фрагменты.
Искусственный интеллект ежедневно достигает новых высот. Способности AI действительно поражают. Chat GPT и его аналоги захватили интернет — с их помощью пишут не только статьи, тексты для рекламы и поздравительных открыток, но и дипломные и курсовые работы. При этом довольно успешные.
Результаты моего тестирования сервисов
Writer AI Content Detector — коммерческий проект, который сделали разработчики ИИ для создания текстов. Он позволяет вставить ссылку на текст или скопировать до 1500 символов в поле на сайте. Затем выдает процент, определяющий, с какой вероятностью текст сгенерирован или написан человеком.
Сервис создан Джастином Макгиллом — предпринимателем с более чем 15-летним опытом в SEO и контент-маркетинге. Благодаря специальным алгоритмам и обучению на базе миллиардов символов реальных текстов, инструмент может точно спрогнозировать наиболее вероятные варианты слов, которые использует ИИ.
Не самый простой, но довольно подробный инструмент, позволяющий проверить текст на нейросеть. Алгоритм анализирует текст на основе огромной базы данных и выделяет слова в тексте, которые входят в топ-10, топ-100 или топ-1000 предсказуемых слов. Чем больше совпадений, тем выше вероятность того, что текст сгенерирован роботом.
Удобен тем, что можно не только добавить текст, но и указать ссылку на него. Инструмент считывает контент со страницы сайта и выдает результат вероятности написания текста человеком или нейронной сетью. В бесплатной версии можно проверить до 1500 символов.
В практическом тесте сервис полностью провалился. Он определил, что сгенерированный текст на русском с вероятностью 97% написан человеком, а на английском — с вероятностью 91%. Текст от моего коллеги он тоже отнес к человеческим. Сложилось впечатление, что цифры выдаются абсолютно случайно. Тем более что сервис никак не комментирует свое решение.
Впрочем, если говорить о предназначении инструмента, то встроенным НейроПомощником нужно в первую очередь пользоваться тем, кто профессионально работает с текстами и всегда проверяет уникальность и другие параметры через Text.ru. Теперь у таких пользователей появилась возможность проверить и наличие рерайта через ИИ. Это актуально как для дипломных работ (правда, придется купить много нейросимволов или оформить безлимитный план), так и для небольших информационных статей.
Стиль текста безэмоциональный. Нейросетям сложно передавать эмоции, сарказм, иронию, юмор. Поэтому их тексты часто выглядят сухими и формальными по стилю. Еще нейросети обучены быть нейтральными и объективными, поэтому они стараются избегать резких, категоричных суждений. В их текстах мало критики, негативных оценок, субъективных мнений.
В копирайтинге ИИ становится одним из самых актуальных инструментов. По мнению некоторых работодателей, если копирайтер хочет зарабатывать выше среднего по рынку, теперь ему просто необходимо уметь грамотно использовать нейросети в работе. И это только один из востребованных навыков, которые помогут выйти на доход в копирайтинге от 80 000 рублей в месяц. Запишитесь на бесплатную карьерную консультацию от студии Контентим — мы составим для вас пошаговый план к успеху.
Письма о технологиях и интернете
Нейросеть опускает контекст и персонализацию текста. ChatGPT не сможет передать опыт конкретного человека — только попытаться имитировать опыт миллионов людей, на чьих текстах обучена модель. Но таким материалам обычно не хватает глубины и авторского ощущения: одно дело — написать шаблонное сочинение по литературному произведению, и другое — рассказать, как ты провел лето.
Выше я уже писал о том, что проверял два одинаковых текста, но на разных языках. Это же я сделал через Content at Scale и оказалось, что данный сайт чуть ли не единственный, который сейчас полностью корректно работает с русским языком. Было проверено еще несколько фрагментов текстов разных тематик и все они распознаны как написанные при помощи нейронных сетей. Поэтому я точно могу рекомендовать к использованию Content at Scale.
Если вы хотите научиться их распознавать, главный совет — практикуйтесь. Пользуйтесь генераторами текстов, экспериментируйте с разными моделями, параметрами, стилями. Чем больше вы будете работать с ИИ , тем скорее научитесь видеть характерные особенности и «артефакты» сгенерированных текстов.
С появлением нейронных сетей для генерирования текстов логично было ожидать, что вместе с ними появятся и сервисы, играющие роль детекторов. Существует множество полезных инструментов, анализирующих содержимое и определяющее вероятность, с которой текст мог быть создан ИИ. Есть разные критерии оценки, и каждый инструмент использует свой подход для качественного анализа. Поэтому отличным вариантом будет один и тот же фрагмент прогнать через несколько сайтов, чтобы получить объективный результат.
В сгенерированном тексте много «воды». Это связано с особенностями обучения нейросетей: они стараются генерировать связные правдоподобные тексты, имитируя стиль и приемы человеческих. При этом нейросети не всегда четко выделяют главную мысль, повторяют одно и то же разными словами, используют ничего не добавляющие к сути фразы. Часто из нескольких абзацев сгенерированного текста вытекает только одна мысль.
Что касается взаимодействия с самим анализатором текста, то этот процесс не станет чем-то трудным и будет понятен каждому пользователю. Единственное – незнающие английский язык могут использовать мою инструкцию ниже или же активировать встроенный в браузер переводчик страниц.
Первый на очереди сайт с названием AI Text Classifier, который как раз был создан OpenAI – разработчиком ChatGPT, поэтому инструмент первоочередно нужно использовать тем юзерам, кто хочет проверить, не был ли текст сгенерирован данным ИИ. Пока можно сказать, что сайт идеально определяет фрагменты текста на английском языке, а вот с распознанием других, особенно если информация компилируется из сборок открытых источников, пока не все так гладко. Впрочем, принцип действия AI Text Classifier и все дополнительные нюансы сразу описаны на главной странице, поэтому предлагаю сначала прочитать документацию, а затем переходить к работе с детектором.
Никаких ограничений для пользователей Content at Scale нет, вы можете проверять бесплатно много разных текстов за один день практически без ограничений по количеству символов. Сама модель детекта тоже работает довольно быстро, поэтому весь процесс не займет много времени.