На этой неделе OpenAI наконец ответила на два практически идентичных коллективных иска от писателей, в том числе Сары Силверман, Пола Тремблея, Моны Авад, Криса Голдена и Ричарда Кадри, которые ранее этим летом утверждали, что ChatGPT был незаконно обучен на пиратских копиях их книг.
В ходатайстве OpenAI об отклонении исков, поданном по обоим делам, компания попросила окружной суд США в Калифорнии отклонить все претензии, кроме одной, касающейся прямого нарушения авторских прав, которую OpenAI надеется опровергнуть на «более поздней стадии дела».
Остальные претензии истцов — о косвенном нарушении авторских прав, нарушении Закона о защите авторских прав в цифровую эпоху (DMCA), недобросовестной конкуренции, халатности и несправедливом обогащении — должны быть «удалены» из исков, «чтобы эти дела не дошли до процесса открытия доказательств и далее, с юридически несостоятельными теориями ответственности», утверждает OpenAI.
OpenAI заявила, что авторы «неправильно понимают масштабы авторских прав, не принимая во внимание ограничения и исключения, включая добросовестное использование, которые должным образом оставляют место для инноваций, подобных большим языковым моделям, которые сейчас находятся на переднем крае искусственного интеллекта».
По словам OpenAI, даже если книги авторов были «крошечной частью» огромного набора данных ChatGPT, «использование материалов, защищенных авторским правом, новаторами в преобразовательных целях не нарушает авторских прав». В отличие от плагиаторов, которые стремятся напрямую нажиться на распространении материалов, защищенных авторским правом, OpenAI утверждает, что ее целью было «научить свои модели выводить правила, лежащие в основе человеческого языка», чтобы делать такие вещи, как помогать людям «экономить время на работе», «упростить повседневную жизнь» или просто развлекать себя, набирая подсказки в ChatGPT.
Цель закона об авторском праве, утверждает OpenAI, состоит в том, чтобы «содействовать прогрессу науки и полезных искусств», защищая способ, которым авторы выражают идеи, но «не саму идею, факты, воплощенные в артикулированном автором сообщении, или другие строительные блоки творчества», которые, по-видимому, являются элементами произведений авторов, полезными для обучающей модели ChatGPT. Ссылаясь на примечательное дело об авторских правах, связанное с Google Books, OpenAI напомнила суду, что «хотя автор может зарегистрировать авторское право на свою книгу, «статистическая информация», относящаяся к «частоте слов, синтаксическим структурам и тематическим маркерам» в этой книге, выходит за рамки защиты авторских прав».
«В соответствии с возникшим судебным прецедентом, не является нарушением создавать «полные копии произведения в качестве предварительного шага» для разработки нового, не нарушающего авторские права продукта, даже если новый продукт конкурирует с оригиналом», — написала OpenAI.
В частности, OpenAI надеется убедить суд в том, что утверждение истцов о косвенном нарушении авторских прав — что каждый вывод ChatGPT представляет собой производное от других произведений, «независимо от того, есть ли какие-либо сходства между выводом и обучающими работами» — является «ошибочным юридическим заключением».
В качестве примеров того, почему каждый отдельный вывод ChatGPT не может всерьез рассматриваться как производное от других произведений в соответствии с «юридически несостоятельной» теорией авторов, OpenAI приводит «простой ответ на вопрос (например, «Да»)», или ответ с «именем президента США», или «абзац, описывающий сюжет, темы и значение «Илиады» Гомера».
«Так не работает закон об авторском праве», — утверждает OpenAI, при этом заявляя, что любые выводы ChatGPT, которые связаны с произведениями авторов, похожи на «рефераты или обзоры».
Кроме того, OpenAI утверждает, что авторы не смогли показать, что у компании есть «прямой финансовый интерес» в предполагаемом нарушении авторских прав на их произведения.
«Недостаточно того, что оспариваемая деятельность осуществляется пользователями инструментов, предлагаемых за плату технологической компанией: скорее, чтобы удовлетворить критерий «прямого финансового интереса», материал, нарушающий авторские права истца, должен «привлекать клиентов» ответчика так, чтобы существовала прямая «причинно-следственная связь между нарушением авторских прав самого истца и прибылью ответчика», — написала OpenAI.
OpenAI также пытается отклонить утверждения о том, что обучающие модели ChatGPT нарушают Закон о защите авторских прав в цифровую эпоху (DMCA).
По словам авторов, любой вывод ChatGPT, который копирует их работы, но исключает информацию об управлении авторскими правами (CMI), такую как имена авторов или годы публикации, нарушает DMCA. Истцы в иске обвинили OpenAI в преднамеренном удалении CMI, чтобы «незаконно нажиться и присвоить заслуги за разработку коммерческого продукта на основе неуказанных воспроизведений этих украденных текстов и идей».
По словам OpenAI, жалобы авторов «поверхностны» и «полностью лишены каких-либо объяснений» того, «как OpenAI могла бы удалить имена авторов и годы публикации из книг в своих обучающих данных, почему OpenAI могла бы сделать такое, или на каком основании истцы полагают, что это произошло».
OpenAI заявила, что не только нет доказательств того, что компания «преднамеренно удалила» CMI, но жалобы истцов «содержат ряд фактов, которые противоречат» этой теории, включая утверждения о том, что книги истцов были ««скопированы OpenAI полностью».
Кроме того, если CMI была удалена из обучающих данных, то, по словам OpenAI, это, вероятно, было ««непреднамеренным побочным эффектом» технологического процесса», как когда поисковая система не несет ответственности за «сканирование изображений из Интернета без сканирования связанной с ними CMI». Такое «случайное удаление CMI», утверждает OpenAI, исключает ответственность и не подтверждает утверждений о том, что OpenAI действовала, чтобы «скрыть проступки» или «скрыть нарушение».
Наконец, OpenAI утверждает, что претензия по DMCA должна быть отклонена, потому что, «даже предположив, что каждый вывод ChatGPT обязательно является «производным от других произведений», DMCA не запрещает «распространение производных от других произведений без CMI, которое сопровождало оригинал». Вместо этого, написала OpenAI, DMCA запрещает удалять CMI при распространении оригинальных произведений или их копий.
OpenAI написала, что остальные три претензии истцов — о нарушении законов Калифорнии, запрещающих недобросовестную конкуренцию, халатность и несправедливое обогащение — должны быть отклонены, поскольку они вытеснены федеральным законом об авторском праве.
Если OpenAI удастся отклонить большинство претензий авторов, единственное, что останется решить суду — нарушает ли обучающая модель OpenAI закон об авторском праве напрямую. Это может означать, что обучающие данные ChatGPT нарушают закон либо путем воспроизведения и распространения оригинальных произведений, либо подготовкой производных от других произведений без разрешения или без достаточных изменений.
Маловероятно, что авторы так просто сдадутся в этой борьбе. Для них генеративный ИИ — это огромное «мошенничество», которое не способствует развитию человеческого разума, а скорее представляет собой копию «человеческого интеллекта», которая была «переупакована и отделена от ее создателей», написала юридическая фирма Joseph Saveri на веб-сайте, обобщающем их жалобы.