OpenAI заключила соглашение с Axel Springer о лицензировании новостей для обучения моделей

Многие, если не большинство, поставщиков технологий генеративного ИИ утверждают, что добросовестное использование дает им право обучать модели ИИ на материалах, защищенных авторским правом, взятых из интернета — даже если они не получили разрешения от правообладателей. Но некоторые поставщики, такие как OpenAI, подстраховываются — возможно, опасаясь исхода соответствующих судебных разбирательств.

Сегодня OpenAI объявила о достижении соглашения с Axel Springer, берлинским владельцем таких изданий, как Business Insider и Politico, об обучении своих генеративных моделей ИИ на контенте издательства и добавлении последних статей, опубликованных Axel Springer, в вирусный чат-бот OpenAI на базе ИИ ChatGPT.

Это уже второе подобное соглашение OpenAI с новостной организацией после того, как стартап заявил, что лицензирует некоторые архивы The Associated Press для обучения моделей.

В дальнейшем пользователи ChatGPT будут получать резюме «избранных» статей из изданий Axel Springer, включая истории, обычно закрытые платной стеной. Фрагменты будут сопровождаться указанием авторства и ссылками на полные тексты статей.

Взамен Axel Springer будет получать от OpenAI платежи неустановленного размера и с неустановленной периодичностью. Сделка рассчитана на несколько лет, и, хотя она не обязывает ни одну из сторон к эксклюзивности, Axel Springer заявляет, что будет поддерживать существующие проекты издания, связанные с искусственным интеллектом, «которые опираются на технологию OpenAI».

«Мы очень рады тому, что сформировали это глобальное партнерство между Axel Springer и OpenAI — первое в своем роде», — сказал генеральный директор Axel Springer Матиас Дёпфнер в официальном заявлении. «Мы хотим изучить возможности журналистики с использованием ИИ, чтобы поднять качество, общественную значимость и бизнес-модель журналистики на новый уровень».

Помимо издателей, использующих генеративный ИИ в сомнительных контент-стратегиях, издатели и поставщики генеративного ИИ находятся в напряженных отношениях: издатели заявляют о нарушении авторских прав и все больше обеспокоены тем, что генеративные модели снижают трафик. Например, новый поисковый сервис Google на основе генеративного ИИ под названием SGE отодвинул ссылки, появляющиеся в традиционном поиске, дальше вниз по страницам результатов поиска, что потенциально может снизить трафик по этим ссылкам на 40 %.

Издатели также возражают против того, чтобы поставщики обучали свои модели на контенте без соглашения о компенсации — особенно в свете сообщений о том, что технологические гиганты, включая Google, экспериментируют с инструментами ИИ для обобщения новостей. Согласно одному из недавних исследований, сотни новостных организаций уже используют код, чтобы не позволить OpenAI, Google и другим компаниям сканировать их сайты для получения обучающих данных.

В августе несколько медиаорганизаций, включая Getty Images, The Associated Press, Национальную ассоциацию фотографов прессы и Гильдию писателей, опубликовали открытое письмо, в котором призвали к большей прозрачности и защите авторских прав в области ИИ. В письме участники призвали политиков рассмотреть нормативные акты, требующие прозрачности наборов данных для обучения и позволяющие медиакомпаниям вести переговоры с поставщиками моделей ИИ, а также другие предложения.

«Нынешняя практика подрывает основные бизнес-модели медиаиндустрии, которые основаны на читательской аудитории и зрительской аудитории (например, подписка), лицензировании и рекламе», — говорится в письме. «Помимо нарушения закона об авторском праве, это приводит к значительному сокращению разнообразия СМИ и подрывает финансовую устойчивость компаний, инвестирующих в освещение событий в СМИ, что еще больше снижает доступ общественности к высококачественной и достоверной информации».

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *