Релиз Claude 2.1 от Anthropic показывает, что конкуренты не сидят сложа руки на фоне кризиса в OpenAI

Может быть, крушение OpenAI и происходит на наших глазах в режиме замедленной съемки, но конкуренты компании не сидят сложа руки. Компания Anthropic только что выпустила Claude 2.1, усовершенствованную версию своей флагманской большой языковой модели, которая позволяет ей конкурировать с серией GPT, а также обладает таким полезным свойством, как «разработка компанией, не ведущей активной войны с самой собою».

Новое обновление Claude включает три основных улучшения: контекстное окно, точность и расширяемость.

Что касается контекстного окна, то есть количества данных, обрабатываемых моделью одновременно, Anthropic обогнала OpenAI: Сэм Альтман на OpenAI DevDay объявил об окне в 128 000 токенов, а Claude 2.1 теперь может обрабатывать 200 000 токенов. Этого достаточно для «целых кодовых баз, финансовых отчетов типа S-1 или даже длинных литературных произведений вроде «Илиады»», — пишет компания.

Конечно, наличие большего объема информации не обязательно означает, что модель справится с ней наилучшим образом. Например, GPT-4 все еще является золотым стандартом в области генерации кода, и Claude будет обрабатывать запросы по-разному, в чем-то лучше, в чем-то хуже, чем ее конкуренты. Все это находится в процессе разработки, и в конечном итоге пользователи сами должны решить, как лучше использовать эти новые возможности.

Точность также предположительно повысилась (это, как известно, сложно оценить количественно), согласно «большому набору сложных, фактологических вопросов, которые выявляют известные слабые места в существующих моделях». Результаты показывают, что Claude 2.1 дает меньше неверных ответов, реже галлюцинирует и лучше оценивает ситуацию, когда не может быть уверена — модель «значительно чаще отказывается от ответа, чем предоставляет неверную информацию». Опять же, насколько это полезно на практике, могут оценить только пользователи.

Наконец, Claude 2.1 теперь может использовать инструменты. Однако здесь нет никаких специальных инструментов для LLM: это больше похоже на агентскую функциональность, которую мы наблюдаем в моделях, предназначенных для взаимодействия с веб-интерфейсами. Если модель обнаруживает, что для решения вопроса лучше всего не рассуждать, а просто воспользоваться калькулятором или известным API, то она так и поступит.

Например, если модель не знает, какой автомобиль или ноутбук порекомендовать человеку, обратившемуся за советом, она может обратиться к модели или базе данных, лучше подготовленной для ответа на этот вопрос, или даже выполнить поиск в Интернете, если это целесообразно.

Эти периодические улучшения, несомненно, будут приветствоваться пользователями, которые регулярно используют Claude, и показывают, что каждый день в OpenAI, потерянный из-за борьбы за власть, — это потенциально потерянный день в пользу конкурентов. Возможно, модели Anthropic не всегда могут сравниться с моделями OpenAI, но эта индустрия развивается быстро. Несколько свободных недель, чтобы наверстать упущенное, могут изменить ситуацию больше, чем кто-либо ожидает.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *