Китайские игроки в области ИИ от Alibaba до государственного института спешат открыть исходный код своих моделей в борьбе за глобальное влияние

Крупные технологические компании Китая, стартапы и учреждения спешат поделиться со всем миром своими большими языковыми моделями (LLM) — программным обеспечением, которое лежит в основе чат-ботов вроде ChatGPT — поскольку они соревнуются за привлечение глобальных пользователей на фоне конкуренции за превосходство в области искусственного интеллекта (ИИ).

Пекинская академия искусственного интеллекта (BAAI), правительственное учреждение, сосредоточенное на фундаментальных исследованиях в области ИИ и его применении в областях от медицины до наук о жизни, стала последним крупным китайским игроком, открывшим исходный код новой модели ИИ BGE для свободного коммерческого использования во вторник.

В июне академия также открыла доступ к своей модели Aquila, которая была предварительно обучена на 7 миллиардах параметров, 40% из них на китайском языке и 60% на английском, согласно вступительному описанию модели на Github.

Возможности модели частично зависят от количества параметров. ChatGPT от OpenAI, например, был обучен на 175 миллиардах параметров. В то время как большинство открытых китайских LLM в настоящее время имеют от 6 до 13 миллиардов параметров, BAAI заявила, что планирует выпустить более продвинутую версию Aquila с 33 миллиардами параметров.

Действия BAAI происходят на фоне того, как облачное подразделение Alibaba Group Holding на прошлой неделе открыло исходный код двух ИИ-моделей на 7 миллиардов параметров, основанных на своей флагманской LLM Tongyi Qianwen, запущенной в апреле.

Доступные как в собственном репозитории Alibaba ModelScope, так и на американской платформе Hugging Face, две модели могут бесплатно использоваться учеными, исследователями и компаниями.

Публикация исходного кода — это способ для таких игроков, как Alibaba и BAAI, расширить свое присутствие в секторе, согласно экспертам.

«До сих пор все с энтузиазмом представляли множество продуктов LLM, выпущенных различными компаниями на фоне усиливающейся конкуренции, но модели более или менее находятся на одном уровне», — сказал Чжан И, основатель и главный аналитик консалтинговой компании iiMedia.

“Раскрытие исходного кода крупной ИИ модели — это стратегия”, — сказал он.

Это может быть особенно верно для менее известных компаний. Baichuan, стартап ИИ, основанный Ван Сяочуанем, основателем и генеральным директором китайской поисковой системы Sogou, в июне объявил об открытии исходного кода своей 13-миллиардной модели Baichuan-13B.

Базирующийся в Пекине стартап Zhipu AI в июне заявил, что откроет исходный код своей 6-миллиардной модели ChatGLM2-6B.

«Я думаю, открытие исходного кода само по себе — это также бизнес-модель… Компании, большие или маленькие, которые выбирают открытие исходного кода своих больших ИИ моделей, надеются получить определенные коммерческие выгоды”, — сказал Ли Дахай, генеральный директор пекинского ИИ-стартапа Modelbest, в интервью Post в июне.

Многие компании хотят задействовать вычислительную мощность LLM, не обучая самостоятельно модель – процесс, который влечёт за собой чрезмерные расходы, согласно Линь Юнхуа, заместителю руководителя и главному инженеру BAAI.

“Переизобретение колес LLM дорого обходится: не только вычислительные мощности и данные дороги, но процесс также использует много электроэнергии», — сказал Линь китайским СМИ в июне.

Ли из Modelbest сказал, что открытие исходного кода обеспечивает для компании недорогой способ выйти на потенциальных клиентов и позволить им получить представление о технологических возможностях фирмы. «Это очень хороший способ найти коммерческие контакты», — сказал он.

Modelbest, которая в мае опубликовала исходный код своей 10-миллиардной двуязычной китайско-английской базовой ИИ-модели CPM-Bee, заявила, что получила заявки на бесплатное использование от более чем 100 компаний.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *