The New York Times требует от OpenAI и Microsoft оплаты за обучающие данные

The New York Times подала в суд на компанию OpenAI и ее ближайшего партнера и инвестора, компанию Microsoft, за то, что они якобы нарушили закон об авторском праве, обучая генеративные модели искусственного интеллекта на контенте Times.

В иске, поданном в Федеральный окружной суд Манхэттена, The New York Times утверждает, что миллионы ее статей были использованы для обучения моделей искусственного интеллекта, включая те, которые лежат в основе сверхпопулярного ChatGPT от OpenAI и Copilot от Microsoft, без ее согласия. The New York Times требует, чтобы OpenAI и Microsoft «уничтожили» модели и обучающие данные, содержащие материал, нарушающий авторские права, и понесли ответственность за «миллиардные убытки», связанные с «незаконным копированием и использованием уникально ценных работ The New York Times».

«Если The New York Times и другие новостные организации не смогут создавать и защищать свою независимую журналистику, возникнет вакуум, который не сможет заполнить ни компьютер, ни искусственный интеллект», — говорится в жалобе The New York Times. «Будет производиться меньше журналистских материалов, и общество понесет огромные убытки».

В заявлении, направленном по электронной почте, представитель OpenAI сказал: «Мы уважаем права создателей и владельцев контента и намерены сотрудничать с ними, чтобы обеспечить им выгоду от технологий ИИ и новых моделей получения дохода. Наши текущие переговоры с The New York Times были продуктивными и продвигались конструктивно, поэтому мы удивлены и разочарованы таким развитием событий. Мы надеемся, что нам удастся найти взаимовыгодный способ сотрудничества, как мы это делаем со многими другими издательствами».

Генеративные модели ИИ «учатся» на примерах, чтобы создавать эссе, код, электронные письма, статьи и многое другое, а производители, такие как OpenAI, ищут в Интернете миллионы и миллиарды таких примеров, чтобы добавить их в свои обучающие наборы. Некоторые примеры находятся в открытом доступе. Другие — нет, они находятся под ограничительными лицензиями, требующими указания источника или определенных форм компенсации.

Поставщики утверждают, что доктрина добросовестного использования обеспечивает надежную защиту их практики веб-скрейпинга. Владельцы авторских прав с этим не согласны; сотни новостных организаций сейчас используют код, чтобы помешать OpenAI, Google и другим компаниям сканировать их сайты на предмет учебных данных.

Конфликт между поставщиками и распространителями привел к росту числа судебных разбирательств, последнее из которых — дело The New York Times.

Актриса Сара Сильверман в июле присоединилась к искам, обвиняя Meta* и OpenAI в том, что они «проглотили» мемуары Сильверман для обучения своих моделей искусственного интеллекта. В отдельном иске тысячи писателей, включая Джонатана Франзена и Джона Гришэма, утверждают, что OpenAI использовала их произведения в качестве обучающих данных без их разрешения или ведома. А несколько программистов ведут дело против Microsoft, OpenAI и GitHub из-за Copilot, инструмента для генерации кода на основе ИИ, который, по словам истцов, был разработан с использованием их кода, защищенного интеллектуальной собственностью.

Хотя The New York Times не первые, кто подал в суд на разработчиков генеративного ИИ в связи с предполагаемым нарушением прав интеллектуальной собственности на письменные произведения, это крупнейшее издательство, участвующее в подобном иске на сегодняшний день, и одно из первых, кто обратил внимание на потенциальный ущерб своему бренду из-за «галлюцинаций» или выдуманных фактов, полученных с помощью генеративных моделей ИИ.

В жалобе The New York Times приводится несколько случаев, когда Bing Chat от Microsoft (теперь он называется Copilot), в основе которого лежит модель OpenAI, выдавал неверную информацию, которая, как утверждалось, исходила от The New York Times — в том числе результаты по «15 самым полезным для сердца продуктам», 12 из которых не упоминались ни в одной статье The New York Times.

The New York Times также утверждает, что OpenAI и Microsoft фактически создают конкурентов новостных издательств, используя работы The New York Times, нанося ущерб бизнесу The New York Times, предоставляя информацию, которая обычно недоступна без подписки — информацию, которая не всегда цитируется, иногда монетизируется и лишена партнерских ссылок, которые The New York Times использует для получения комиссионных.

Как указывается в жалобе The New York Times, генеративные модели ИИ склонны повторять обучающие данные, например, воспроизводить почти дословно полученные результаты из статей. Кроме того, OpenAI, по крайней мере в одном случае, непреднамеренно позволил пользователям ChatGPT получить возможность обойти ограничения на платный новостной контент.

«Ответчики стремятся бесплатно воспользоваться огромными инвестициями The New York Times в свою журналистику», — говорится в жалобе, обвиняющей OpenAI и Microsoft в «использовании контента The New York Times без оплаты для создания продуктов, которые заменяют The New York Times и уводят у нее аудиторию».

Воздействие на бизнес новостных подписок — и веб-трафик издателей — лежит в основе аналогичного по сути иска, поданного издателями ранее в этом месяце против Google. В этом деле истцы, как и The New York Times, утверждали, что эксперименты Google в области технологий генеративного ИИ, включая чат-бот Bard, работающий на основе искусственного интеллекта, и Search Generative Experience, отнимают у издателей контент, читателей и доходы от рекламы, используя антиконкурентные методы.

Утверждениям издателей можно верить. Недавно The Atlantic провела исследование, согласно которому, если бы поисковая система, например Google, внедрила искусственный интеллект в поиск, то в 75 % случаев ответ на запрос пользователя не требовал бы перехода на сайт компании. По оценкам издателей, подавших иск к Google, они потеряют до 40 % трафика.

Но это не означает, что они добьются успеха в суде. Хизер Микер, партнер-основатель OSS Capital и консультант по вопросам интеллектуальной собственности, включая лицензионные соглашения, сравнила приведенный The New York Times пример с «использованием текстового редактора для копирования и вставки».

«В жалобе The New York Times приводит пример сессии ChatGPT, посвященной обзору ресторана за 2012 год», — сказала Микер. «Подсказка для ChatGPT звучит так: «Какими были начальные абзацы этого обзора?». Затем в следующих подсказках неоднократно запрашивается «следующее предложение». Если пользователь намеренно заставляет чат-бота копировать текст, это его вина. И именно поэтому большинство подобных исков, вероятно, потерпят неудачу».

Некоторые новостные издания, вместо того чтобы бороться с поставщиками генеративного ИИ в суде, решили заключить с ними лицензионные соглашения. В июле Associated Press заключило сделку с OpenAI, а немецкий издатель Axel Springer, которому принадлежат Politico и Business Insider, сделал то же самое в этом месяце.

В своей жалобе The New York Times утверждает, что в апреле пыталась заключить лицензионное соглашение с Microsoft и OpenAI, но переговоры в итоге не увенчались успехом.

*Meta признана экстремистcкой организацией в России.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *