Авторы теряют терпение в отношении ИИ

В понедельник утром многие писатели проснулись и узнали, что их книги были загружены и отсканированы в огромный набор данных без их согласия. Проект облачного текстового процессора Shaxpir под названием Prosecraft собрал более 27 000 книг, сравнивая, ранжируя и анализируя их на основе «яркости» используемого языка. Многие авторы, включая мегапопулярную писательницу в жанре молодежной литературы Морин Джонсон (Maureen Johnson), и автора бестселлера «Little Fires Everywhere» Селесту Нг (Celeste Ng), высказались против того, чтобы Prosecraft обучала модель на их книгах, без их согласия. Даже книги, опубликованные менее месяца назад, уже были загружены.

После целого дня справедливого возмущения в интернете создатель Prosecraft Бенджи Смит закрыл сайт, который существовал с 2017 года.

«Я потратил тысячи часов на этот проект, очищая и аннотируя текст, организуя и настраивая все», — написал Смит. «Но тем временем появился «ИИ». И появление ИИ на сцене было испорчено ранними применениями, позволяющими кому угодно подражать художникам, исключая самих создателей из их творческого процесса».

Проект Prosecraft Смита не был генеративным ИИ-инструментом, но авторы беспокоились, что он может им стать, поскольку Смит собрал набор данных объемом четверть миллиарда слов из опубликованных книг, найдя их путем сканирования интернета.

Prosecraft показывал два абзаца из книги, один «наиболее пассивный» и один «наиболее яркий». Затем он размещал книги в процентные рейтинги на основе их яркости, длины или пассивности.

«Если вы писатель по профессии, это сводит с ума, отчасти потому, что стиль — это не то же самое, что написание гребаного технического задания для бизнеса, которому нужен активный залог или что-то еще», — сказала автор Илана Масад. «Стиль — это стиль!»

Смит не ответил на многочисленные просьбы прокомментировать ситуацию, но в своем посте в блоге он подробнее объяснил свои намерения.

«Поскольку я публиковал только сводные статистические данные и небольшие фрагменты текста этих книг, я полагал, что придерживаюсь духа доктрины добросовестного использования, которая не требует согласия первоначального автора», — написал Смит. Некоторые авторы отметили, что отрывки их книг на Prosecraft включали крупные спойлеры, что вызвало дополнительное раздражение.

Несмотря на извинения Смита, авторы остаются раздраженными. Для художников и писателей последнее распространение ИИ-инструментов создало глубоко раздражающую игру в кошки-мышки. Как только они отказываются от одной базы данных, они обнаруживают, что их работа была использована для обучения другой ИИ-модели, и так далее.

«Похоже, что это практически норма, насколько я могу судить, для этих сайтов и проектов делать все, что они делают, сначала, а затем надеяться, что никто не заметит, и потом исчезнуть или защищаться, когда они неизбежно это сделают», — сказала Масад.

Генеративный ИИ и технология, лежащая в основе самоиздания, создали идеальный шторм для мошеннической деятельности. Amazon заполонили низкокачественные гиды по путешествиям и даже детские книги, сгенерированные ИИ. Но такие инструменты, как ChatGPT, по сути обучены на сумме всех данных в Интернете, поэтому это означает, что настоящие писатели путеводителей или детских книг могут неумышленно подвергаться плагиату.

Писательница Джейн Фридман написала в недавней записи в блоге под названием «Я предпочла бы, чтобы мои книги стали пиратскими, чем это», что за нее выдают себя на Amazon, где кто-то продает книги под ее именем, которые, похоже, написаны с помощью ИИ.

Хотя Фридман удалось удалить эти поддельные книги со своей страницы Goodreads, она говорит, что Amazon не удалит книги с продажи, пока у нее нет товарного знака на свое имя.

«Я не думаю, что какой-либо писатель серьезно убежден, что ИИ собирается испортить книги, потому что, ну, так не работает литература, и все, что я видела написанное ChatGPT как «история», просто очень скучно без голоса или настоящего мастерства или стиля», — сказала Масад.

Но она беспокоится, что издатели будут убеждены в обратном и, возможно, заменят маркетинговые и PR-команды контентом, сгенерированным ИИ, для продвижения.

«Это вызывает очень плохие чувства», — говорит она.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *