Многие, если не большинство, поставщиков технологий генеративного ИИ утверждают, что добросовестное использование дает им право обучать модели ИИ на материалах, защищенных авторским правом, взятых из интернета — даже если они не получили разрешения от правообладателей. Но некоторые поставщики, такие как OpenAI, подстраховываются — возможно, опасаясь исхода соответствующих судебных разбирательств.
Сегодня OpenAI объявила о достижении соглашения с Axel Springer, берлинским владельцем таких изданий, как Business Insider и Politico, об обучении своих генеративных моделей ИИ на контенте издательства и добавлении последних статей, опубликованных Axel Springer, в вирусный чат-бот OpenAI на базе ИИ ChatGPT.
Это уже второе подобное соглашение OpenAI с новостной организацией после того, как стартап заявил, что лицензирует некоторые архивы The Associated Press для обучения моделей.
В дальнейшем пользователи ChatGPT будут получать резюме «избранных» статей из изданий Axel Springer, включая истории, обычно закрытые платной стеной. Фрагменты будут сопровождаться указанием авторства и ссылками на полные тексты статей.
Взамен Axel Springer будет получать от OpenAI платежи неустановленного размера и с неустановленной периодичностью. Сделка рассчитана на несколько лет, и, хотя она не обязывает ни одну из сторон к эксклюзивности, Axel Springer заявляет, что будет поддерживать существующие проекты издания, связанные с искусственным интеллектом, «которые опираются на технологию OpenAI».
«Мы очень рады тому, что сформировали это глобальное партнерство между Axel Springer и OpenAI — первое в своем роде», — сказал генеральный директор Axel Springer Матиас Дёпфнер в официальном заявлении. «Мы хотим изучить возможности журналистики с использованием ИИ, чтобы поднять качество, общественную значимость и бизнес-модель журналистики на новый уровень».
Помимо издателей, использующих генеративный ИИ в сомнительных контент-стратегиях, издатели и поставщики генеративного ИИ находятся в напряженных отношениях: издатели заявляют о нарушении авторских прав и все больше обеспокоены тем, что генеративные модели снижают трафик. Например, новый поисковый сервис Google на основе генеративного ИИ под названием SGE отодвинул ссылки, появляющиеся в традиционном поиске, дальше вниз по страницам результатов поиска, что потенциально может снизить трафик по этим ссылкам на 40 %.
Издатели также возражают против того, чтобы поставщики обучали свои модели на контенте без соглашения о компенсации — особенно в свете сообщений о том, что технологические гиганты, включая Google, экспериментируют с инструментами ИИ для обобщения новостей. Согласно одному из недавних исследований, сотни новостных организаций уже используют код, чтобы не позволить OpenAI, Google и другим компаниям сканировать их сайты для получения обучающих данных.
В августе несколько медиаорганизаций, включая Getty Images, The Associated Press, Национальную ассоциацию фотографов прессы и Гильдию писателей, опубликовали открытое письмо, в котором призвали к большей прозрачности и защите авторских прав в области ИИ. В письме участники призвали политиков рассмотреть нормативные акты, требующие прозрачности наборов данных для обучения и позволяющие медиакомпаниям вести переговоры с поставщиками моделей ИИ, а также другие предложения.
«Нынешняя практика подрывает основные бизнес-модели медиаиндустрии, которые основаны на читательской аудитории и зрительской аудитории (например, подписка), лицензировании и рекламе», — говорится в письме. «Помимо нарушения закона об авторском праве, это приводит к значительному сокращению разнообразия СМИ и подрывает финансовую устойчивость компаний, инвестирующих в освещение событий в СМИ, что еще больше снижает доступ общественности к высококачественной и достоверной информации».