Анализ кризиса авторского права в генеративном ИИ

Недавний взрыв таких инструментов искусственного интеллекта, как ChatGPT и Copilot, значительно усилили помощь, доступную программистам. Однако ИИ-помощники могут удалять комментарии, встроенные в код для передачи авторских прав и руководящих указаний по атрибуции, оставляя кодеров-людей в неведении, но по-прежнему юридически ответственными за нарушение интеллектуальной собственности.

Чтобы бороться с этой проблемой, исследователи в области информатики и инженерии в Инженерной школе Маккелви при Вашингтонском университете в Сент-Луисе разработали CodeIPPrompt — первую автоматизированную платформу тестирования для оценки объема кода, нарушающего интеллектуальную собственность, который генерируют языковые модели. В команду входят Нинг Чжан и Чэнгуан Ван, оба — доценты; Евгений Воробейчик, профессор; Чжиюань Юй, аспирант в лаборатории Чжана и первый автор статьи; и Чаовэй Сяо, доцент информатики в Университете штата Аризона.

Юй представил работу 23 июля на Международной конференции по машинному обучению в Гонолулу. Примечательно, что анализ команды показал, что проблемы нарушения авторских прав распространены в передовых открытых моделях, включая CodeRl, CodeGen и CodeParrot, а также в коммерческих продуктах, включая Copilot, ChatGPT и GPT-4.

«Мы разработали этот инструмент, чтобы помочь людям понять, что если они используют эти большие языковые модели для помощи в написании кода, есть большая вероятность, что они могут сгенерировать контент, нарушающий интеллектуальную собственность, — сказал Чжан. — Как пользователи, мы несем ответственность за этичное использование ИИ. На это влияет то, как мы понимаем технологию ИИ и контент, который она производит».

Хотя CodeIPPrompt не может точно сказать, является ли сгенерированный ИИ код нарушением интеллектуальной собственности, — Чжан отмечает, что этот вопрос в конечном итоге является юридическим и будет решаться в судах по мере рассмотрения дел против пользователей инструментов ИИ за нарушение авторских прав, — он может дать пользователям оценку риска, которая указывает на то, насколько сгенерированный код похож на охраняемый авторским правом контент. Чжан предполагает, что этот инструмент поможет направить продолжающееся развитие ИИ и укажет на потенциальные стратегии смягчения последствий и другие меры защиты от нарушений интеллектуальной собственности в будущем.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *