В начале этого года GitHub выпустил Copilot Chat, чат-бот, ориентированный на программирование и похожий на ChatGPT, для организаций, подписанных на Copilot for Business. Совсем недавно Copilot Chat появился в бета-версии для индивидуальных клиентов Copilot — тех, кто платит 10 долларов в месяц. А теперь GitHub запускает Copilot Chat в общий доступ для всех пользователей.
С сегодняшнего дня Copilot Chat доступен на боковой панели в IDE Microsoft, Visual Studio Code и Visual Studio — в составе платных тарифов GitHub Copilot и бесплатно для проверенных преподавателей, студентов и сопровождающих некоторых проектов с открытым исходным кодом.
«Будучи домом для разработчиков всего мира, мы вывели на рынок то, что сейчас является самым распространенным ИИ-инструментом для разработчиков в истории», — сказала Шуйин Чжао, вице-президент по управлению продуктами GitHub. «И завершение кода было только началом».
С момента выхода бета-версии Copilot Chat мало что изменилось.
Чат-бот по-прежнему работает на GPT-4, флагманской модели генеративного ИИ OpenAI, доработанной специально для сценариев разработки. Разработчики могут обращаться к Copilot Chat на естественном языке, чтобы получить подсказки в реальном времени, например, попросить Copilot Chat объяснить концепции, обнаружить уязвимости или написать модульные тесты.
Как и все генеративные модели ИИ, модель, лежащая в основе Copilot Chat, GPT-4, была обучена на общедоступных данных — некоторые из них защищены авторским правом или находятся под ограниченной лицензией. Поставщики, включая GitHub, утверждают, что доктрина добросовестного использования защищает их от претензий по авторским правам. Но это не помешало программистам подать коллективные иски против GitHub, Microsoft (материнской компании GitHub) и OpenAI в связи с нарушением лицензирования открытого исходного кода и прав интеллектуальной собственности, как они утверждают.
На вопрос к Чжао, будет ли у владельцев кодовых баз возможность отказаться от обучения, если они захотят это сделать, она ответила, что в связи с более широким запуском Copilot Chat нового механизма для этого не предусмотрено, и вместо этого предложила владельцам кодовых баз сделать свои репозитории закрытыми, чтобы предотвратить их включение в будущие обучающие наборы.
Надо полагать, что владельцы кодовых баз не очень-то обрадуются такому предложению — есть много причин держать защищенный авторским правом код в открытом доступе. Но GitHub, очевидно, не хочет идти на уступки в вопросе отказа от данных для обучения — по крайней мере, пока.
Генеративные модели ИИ, включая GPT-4, также склонны к галлюцинациям или уверенному придумыванию фактов — что особенно проблематично в сфере кодирования. Согласно недавнему исследованию, проведенному в Стэнфорде, разработчики, использующие ИИ-помощников для написания кода, как правило, создают менее безопасный код по сравнению с теми, кто не использует ИИ-помощников, отчасти потому, что ИИ-помощники внедряют ошибочные или устаревшие фрагменты кода.
Чжао отметила, что GPT-4 «лучше» противостоит галлюцинациям по сравнению со старой моделью, на которой когда-то работал Copilot, и указала на функции защиты от эксплойтов, такие как фильтры для небезопасных шаблонов кода, которые уведомляют пользователей Copilot Chat об уязвимостях, таких как жестко закодированные учетные данные, SQL-инъекции. Однако она подчеркнула важность тщательной проверки человеком любого кода, предложенного ИИ.
«GitHub Copilot работает на основе моделей OpenAI, которые, как мы выяснили, являются лучшими моделями для сервисов, которые мы предлагаем сегодня», — сказала Чжао. «Мы находимся в очень сильной позиции, чтобы продолжать предоставлять разработчикам инструменты ИИ, необходимые им для создания лучшего, более безопасного программного обеспечения в широких масштабах, получая при этом от удовольствие от работы».
В октябре генеральный директор Microsoft Сатья Наделла сообщил аналитикам, что у Copilot 1 миллион платящих пользователей и около 37 000 корпоративных клиентов. Но GitHub должен сделать Copilot еще более привлекательным, чтобы не уступить место конкурентам — и, если уж на то пошло, не потерять деньги.
Согласно статье в Wall Street Journal, Copilot теряет в среднем 20 долларов в месяц на пользователя, а некоторые клиенты обходятся GitHub в 80 долларов в месяц. Как сообщается, всему виной высокая стоимость работы базовых моделей искусственного интеллекта — с этой проблемой столкнулся и стартап Kite, занимающийся кодированием с использованием технологии генеративного искусственного интеллекта, который был вынужден прекратить свою деятельность в начале декабря прошлого года.
Пока GitHub пытается сделать Copilot прибыльным, Amazon продолжает модернизировать CodeWhisperer, возможно, самого обеспеченного ресурсами конкурента Copilot.
В апреле Amazon сделала CodeWhisperer бесплатным для разработчиков без каких-либо ограничений на использование. В том же месяце был запущен CodeWhisperer Professional Tier, который добавил единый вход в систему с интеграцией AWS Identity and Access Management, а также более высокие ограничения на сканирование уязвимостей безопасности. В сентябре был запущен корпоративный план CodeWhisperer. А в начале ноября Amazon «оптимизировала» CodeWhisperer для предоставления «расширенных» предложений по разработке приложений на основе MongoDB, программы управления базами данных с открытым исходным кодом.
Помимо CodeWhisperer, конкуренцию Copilot составляют такие стартапы, как Magic, Tabnine, Codegen и Laredo, а также модели с открытым исходным кодом, такие как Code Llama от Meta* и StarCoder от Hugging Face и ServiceNow.
*Meta признана экстремистcкой организацией в России.