Anthropic выпускает улучшенную версию своей базовой модели LLM

Anthropic, AI-стартап, основанный бывшими сотрудниками OpenAI, выпустил обновленную версию своей более быстрой и дешевой модели генерации текста, доступной через API, Claude Instant.

Обновленная Claude Instant, Claude Instant 1.2, включает в себя сильные стороны недавно анонсированной флагманской модели Anthropic, Claude 2, демонстрируя «значительные» улучшения в таких областях, как математика, программирование, логическое мышление и безопасность, согласно заявлению Anthropic. Во внутренних тестах Claude Instant 1.2 набрала 58,7% по тесту на программирование по сравнению с 52,8% у Claude Instant 1.1 и 86,7% по набору математических вопросов против 80,9% у Claude Instant 1.1.

«Claude Instant генерирует более длинные, более структурированные ответы и лучше следует инструкциям по форматированию, — пишет Anthropic в блоге. Instant 1.2 также демонстрирует улучшения в извлечении цитат, мультиязычных возможностях и ответах на вопросы».

Anthropic утверждает, что Claude Instant 1.2 менее склонна к галлюцинациям и более устойчива к попыткам джейлбрейка. В контексте крупных языковых моделей, таких как Claude, «галлюцинация» — это когда модель генерирует неверный или бессмысленный текст, а джейлбрейк — это техника, которая использует хитро сформулированные подсказки, чтобы обойти меры безопасности, установленные создателями крупных языковых моделей.

А у Claude Instant 1.2 размер контекстного окна такой же, как у Claude 2, — 100 000 токенов. Контекстное окно — это текст, который модель анализирует перед генерацией дополнительного текста, а токены представляют собой исходный текст (например, слово «fantastic» будет разбито на токены «fan», «tas» и «tic»). Claude Instant 1.2 и Claude 2 могут анализировать примерно 75 000 слов, примерно длиной с «Великого Гэтсби».

В целом, модели с большими контекстными окнами менее склонны «забывать» содержание недавних бесед.

Как уже сообщалось ранее, амбиции Anthropic заключаются в создании «алгоритма следующего поколения для самообучения ИИ», как они описывают это в презентации для инвесторов. Такой алгоритм может использоваться для создания виртуальных помощников, которые могут отвечать на электронные письма, проводить исследования и генерировать искусство, книги и многое другое — некоторые из которых мы уже ощутили с появлением GPT-4 и других крупных языковых моделей.

Но Claude Instant — это не такой алгоритм. Скорее, он призван конкурировать с аналогичными базовыми предложениями от OpenAI, а также стартапами, такими как Cohere и AI21 Labs, которые разрабатывают и производят собственные системы ИИ для генерации текста и, в некоторых случаях, изображений.

На сегодняшний день Anthropic, запущенный в 2021 году под руководством бывшего вице-президента OpenAI по исследованиям Дарио Амодеи, привлек 1,45 миллиарда долларов. Хотя это может показаться много, это намного меньше того, что, по оценкам компании, потребуется — 5 миллиардов долларов в течение следующих двух лет — чтобы создать планируемый чат-бот.

Anthropic утверждает, что в настоящее время у него «тысячи» клиентов и партнеров, в том числе Quora, которая предоставляет доступ к Claude и Claude Instant через свое приложение для генеративного ИИ с подпиской Poe. Claude работает на инструменте DuckAssist от DuckDuckGo, который напрямую отвечает на простые поисковые запросы пользователей в сочетании с ChatGPT от OpenAI. А в Notion Claude является частью технической основы Notion AI, помощника по написанию, интегрированного в рабочее пространство Notion.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *