Инструменты обнаружения текста, основанные на искусственном интеллекте (ИИ), довольно легко обмануть

Последняя серия систем ИИ, заявляющих о способности обнаруживать текст, созданный искусственным интеллектом, показывает плохие результаты, и для их обхода не требуется много усилий.

В течение нескольких недель после запуска ChatGPT появились опасения, что студенты будут использовать чат-бота для быстрого создания приемлемых эссе. В ответ на эти опасения стартапы начали создавать продукты, которые обещают определять, написан ли текст человеком или машиной.

Проблема заключается в том, что согласно новым исследованиям, которые еще не прошли рецензирование, эти инструменты относительно легко обмануть и избежать их обнаружения.

Дебора Вебер-Вульфф, профессор медиа и вычислительной техники в Высшей школе прикладных наук HTW Berlin, совместно с группой исследователей из разных университетов провела оценку способности 14 инструментов, включая Turnitin, GPT Zero и Compilatio, обнаруживать текст, написанный ChatGPT от OpenAI.

Большинство этих инструментов работают, исходя из признаков текста, сгенерированного ИИ, таких как повторение, и затем рассчитывают вероятность того, что текст был создан ИИ. Однако команда исследователей обнаружила, что все протестированные инструменты с трудом распознавали текст, сгенерированный ChatGPT, который был незначительно перестроен людьми и затем усложнен с помощью инструмента для перефразировки, что подразумевает, что все, что студентам нужно сделать, это немного адаптировать эссе, созданные ИИ, чтобы обойти детекторы.

«Эти инструменты не работают», — говорит Вебер-Вульфф. «Они не делают то, что заявляют. Они не обнаруживают ИИ».

Исследователи оценили эти инструменты, написав короткие эссе на уровне бакалавра по различным предметам, включая гражданскую инженерию, компьютерные науки, экономику, историю, лингвистику и литературу. Они сами написали эссе, чтобы убедиться, что текст еще не размещен в Интернете и не мог быть использован для обучения ChatGPT.

Затем каждый исследователь написал дополнительный текст на боснийском, чешском, немецком, латышском, словацком, испанском или шведском языке. Эти тексты были переданы через инструмент машинного перевода DeepL или Google Translate для их перевода на английский язык.

Команда затем использовала ChatGPT, чтобы сгенерировать еще два дополнительных текста, которые они немного изменяли, чтобы скрыть, что они были созданы ИИ. Одна группа текстов была редактирована вручную исследователями, которые изменяли порядок предложений и заменяли слова, а другая группа была переписана с использованием инструмента для перефразировки под названием Quillbot. В результате они получили 54 документа для проверки инструментов обнаружения.

Оказалось, что инструменты хорошо распознавали текст, написанный человеком (с точностью в среднем 96%), но они проявляли более низкую эффективность в распознавании текста, созданного ИИ, особенно после его редактирования. Хотя инструменты распознавали текст ChatGPT с точностью 74%, эта цифра снизилась до 42% после незначительных изменений в тексте, созданном ChatGPT.

Такие исследования также подчеркивают устаревшие методы университетов для оценки студенческих работ, говорит Витомир Кованович, старший преподаватель, создающий модели машинного обучения и ИИ в Университете Южной Австралии, который не участвовал в проекте.

Дафна Ипполито, старший исследователь в Google, специализирующийся на генерации естественного языка, также не принимала участие в проекте и высказала другую озабоченность.

«Если автоматические системы обнаружения будут использоваться в образовательных учреждениях, крайне важно понять их уровень ложных срабатываний, поскольку неправильное обвинение студента в обмане может иметь серьезные последствия для его учебной карьеры», — говорит она. «Также важна и ошибка первого рода, поскольку если слишком много текстов, созданных ИИ, проходят как написанные человеком, то система обнаружения не будет полезной».

Compilatio, создатель одного из инструментов, протестированных исследователями, отмечает, что важно помнить, что их система только указывает на подозрительные места, которые классифицируются как потенциальный плагиат или содержание, возможно, созданное ИИ.

«Это зависит от школ и преподавателей, которые оценивают анализируемые документы, чтобы подтвердить или приписать знания, фактически полученные автором документа, например, путем проведения дополнительных проверок — устного опроса, дополнительных вопросов в контролируемой аудиторной среде и т. д.», — заявил представитель Compilatio. «Таким образом, инструменты Compilatio являются частью настоящего учебного подхода, который способствует изучению правильных практик исследования, написания и цитирования. Программное обеспечение Compilatio является инструментом для коррекции, а не автоматическим исправителем». Компании Turnitin и GPT Zero не сразу ответили на запрос комментария.

Мы знали уже давно, что инструменты, предназначенные для обнаружения текста, созданного ИИ, не всегда работают так, как предполагается. В начале этого года OpenAI представила инструмент для обнаружения текста, созданного ChatGPT, признав, что он обнаруживает только 26% текстов, созданных ИИ, как «вероятно, созданные ИИ». OpenAI ссылается на раздел на своем веб-сайте для преподавателей, посвященный обсуждениям, который предупреждает, что инструменты, предназначенные для обнаружения содержимого, созданного ИИ, «далеки от идеала».

Однако такие неудачи не останавливают компании в их стремлении выпустить продукты, обещающие выполнить эту задачу, говорит Том Голдштейн, ассистент профессора в Университете Мэриленда, не участвовавший в исследовании.

«Многие из них не очень точны, но не все они полностью неудачны», — добавляет он, отмечая, что Turnitin смог достичь некоторой точности обнаружения с низкой вероятностью ложных срабатываний. И хотя исследования, раскрывающие недостатки так называемых систем обнаружения ИИ-текста, являются очень важными, было бы полезно расширить сферу исследования на другие ИИ-инструменты, кроме ChatGPT, считает Саша Луксиони, исследователь в стартапе по искусственному интеллекту Hugging Face.

По мнению Ковановича, сама идея попыток обнаружить текст, созданный ИИ, неправильна.

«Не пытайтесь обнаружить ИИ — сделайте так, чтобы использование ИИ не было проблемой», — говорит он.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *