Искусственный интеллект, дает людям возможность создавать в больших масштабах, а бизнесу — возможность работать умнее и эффективнее.
Одной из областей, которая уже оказывает влияние, является генерация текста на естественном языке. Мощные модели машинного обучения, такие как GPT-4 и PaLM 2, могут генерировать текст, похожий на человеческий, на основе простых подсказок. Такие системы имеют потенциал автоматизировать широкий спектр задач для повышения производительности и получения быстрых результатов.
Что такое модели генерации текста?
Модели генерации текста — это модели искусственного интеллекта, обученные на огромных объемах текста. При запросе они могут генерировать новый контент, переставляя и комбинируя фразы. Такие модели могут генерировать контент только на основе своих тренировочных данных — поэтому, хотя он может быть «новым» с точки зрения его порядка, информация никогда не будет совершенно новой.
Результаты могут казаться похожими на человеческий текст и могут применяться в различных случаях использования, от помощи в творческом письме до разговорных чат-ботов на базе искусственного интеллекта. Однако эта технология также вызывает опасения относительно возможного злоупотребления для генерации дезинформации, подражания другим людям в интернете и даже юридические вопросы, связанные с авторским правом и конфиденциальностью.
Вот список моделей генерации текста и приложений, построенных на их основе.
Модели генерации текста
- GPT-4
Создатель: OpenAI
Первая публикация: март 2023 года
GPT-4 — флагманская большая языковая модель OpenAI. Она может генерировать текст как на основе изображений, так и на основе текстовых вводов.
GPT-4 была разработана для замены GPT-3 и GPT-3.5, используемых для настройки ChatGPT. Она поддерживает ChatGPT Plus, платную подписку OpenAI за 20 долларов в месяц.
О масштабе и подробностях GPT-4 известно немного. В отличие от предыдущих моделей GPT, OpenAI решила держать все в секрете. Однако, по сообщениям, модель имеет огромные 1,76 трлн параметров, что значительно больше предыдущих версий GPT.
- GPT-3
Создатель: OpenAI
Первая публикация: июнь 2020 года
Одна из самых известных моделей генерации текста в мире — GPT-3.
Хотя GPT-3 уже устарела по сравнению с GPT-4, она регулярно подвергалась настройке и доработке для применения в других случаях использования и приложениях, таких как генерация кода с помощью Codex.
GPT-3 использовалась во многих приложениях, включая текстовые игры в жанре приключений AI Dungeon, создание виртуальных персонажей в VR с Fable Studios и социальные проекты от Create Labs. Однако Microsoft имела «исключительную лицензию» на использование GPT-3.
- PaLM
Создатель: Google
Первая публикация: апрель 2022 года
Текущая версия: PaLM 2
Google PaLM — флагманская модель большого языка от поискового гиганта. PaLM 2, представленная на конференции I/O 2023, заменила модель большого языка LaMDA в приложении их чат-бота Bard.
PaLM 2 поддерживает более 100 языков и разработана для настройки под конкретные области применения и приложения. Например, Sec-PaLM, которая была настроена для кибербезопасности, или Med-PaLM-2, которая может помочь врачам определить медицинские проблемы по изображениям, таким как рентгенограммы.
Подобно GPT-4 от OpenAI, Google не разглашает размер PaLM 2. Первая версия PaLM, представленная в апреле 2022 года, имела 540 млрд параметров и была разработана для использования в разговорных приложениях.
- Claude
Создатель: Anthropic, стартап по искусственному интеллекту, основанный бывшими инженерами OpenAI. Среди его инвесторов такие компании, как Google и Salesforce.
Первая публикация: март 2023 года
Текущая версия: Claude 2
Claude — это чат-бот, похожий на ChatGPT и специально разработанный для создания безопасного контента.
Он использует подход, называемый «конституционный искусственный интеллект», чтобы предотвратить генерацию потенциально вредного контента, давая модели набор принципов, которым нужно следовать.
Claude имеет значительную длину контекста, охватывающую около 100 000 токенов текста, или около 75 000 слов, что позволяет ему обрабатывать длинные документы.
- Inflection-1
Создатель: Inflection, стартап по искусственному интеллекту, базирующийся в Силиконовой долине, с поддержкой Билла Гейтса, бывшего генерального директора Google Эрика Шмидта и сооснователя LinkedIn Рида Хоффмана.
Первая публикация: июнь 2023 года
Одна из самых новых моделей искусственного интеллекта в этом списке, Inflection-1 была создана для работы виртуального ассистента Pi.ai стартапа.
Для модели использовались собственные технические методы, чтобы она работала на уровне Chinchilla от DeepMind и PaLM от Google.
- Einstein GPT
Создатель: Salesforce
Первая публикация: март 2023 года
Einstein GPT может генерировать персонализированные электронные письма для продавцов и создавать ответы для специалистов по обслуживанию клиентов при обработке запросов клиентов.
Она была создана компанией Salesforce, объединившей свои собственные данные с технологией предприятий от ChatGPT — разработчика OpenAI.
- Cohere Command
Создатель: Cohere
Первая публикация: июнь 2022 года
Текущая версия: Command-nightly
Command — это флагманская модель генерации искусственного интеллекта от Cohere. Она может генерировать текст из настраиваемых источников данных, что позволяет бизнесу настраивать ее для конкретных случаев использования.
Command может создавать описания продуктов, помогать составлять электронные письма, предлагать примеры пресс-релизов и отвечать на несколько вопросов о документах.
Она является одной из немногих моделей искусственного интеллекта в этом списке, которая регулярно развивается — Cohere выпускает новую версию модели Command-nightly каждую неделю.
- Bloom
Создатель: BigScience, исследовательская мастерская, возглавляемая Hugging Face и объединяющая более 1000 исследователей из 60 стран
Первая публикация: июль 2022 года
Bloom — это многоязыковая модель искусственного интеллекта с 176 миллиардами параметров, которая является открытым и общим ресурсом. Bloom может генерировать текст на 46 естественных языках и владеет 13 языками программирования.
- LLaMA
Создатели: Meta*, FAIR
Первая публикация: февраль 2023 года
Текущая версия: Llama 2
LlaMA — или Large Language Model Meta* AI — это открытая языковая модель от Meta*. Она разработана для дальнейшего развития и стала основой для множества открытых моделей, включая Alpaca и Gorilla, хотя LLaMA открыта только для исследовательского использования.
Модели LLaMA варьируются от семи миллиардов параметров до 65 миллиардов параметров, и более маленькие модели предпочитаются исследователями из-за меньшего объема вычислений, необходимых для их запуска.
Отмечается, что с 13 миллиардами параметров, модель LLaMA превосходит модель GPT-3 от OpenAI, которая имеет 175 миллиардов параметров, «по большинству показателей», согласно документу Meta*.
Meta* предоставляет последнюю версию, Llama 2, бесплатно для исследовательского и коммерческого использования. Она представлена в трех размерах: семь миллиардов, 13 миллиардов и 70 миллиардов параметров.
- Jurassic
Создатель: AI21 Labs, конкурент OpenAI из Тель-Авива
Первая публикация: август 2021 года
Текущая версия: Jurassic-2
Jurassic предлагает настраиваемые модели языка, предназначенные для обработки естественного языка. Текущая версия, J2, доступна через AI21 Studio, платформу NLP-as-a-service компании.
J2 представлена в трех моделях — Large, Grande и Jumbo, а также в языковых версиях Jumbo и Grande с настроенными инструкциями.
- Luminous
Создатель: немецкий стартап по искусственному интеллекту Aleph Alpha
Первая публикация: апрель 2022 года
Luminous может создавать текст на основе естественных языковых подсказок.
Luminous имеет четыре размера: Luminous-base — самая маленькая модель, предназначенная для недорогих приложений; Luminous-extended — средняя модель, разработанная для случаев использования, требующих скорости, и также принимающая изображения в качестве входных данных; Luminous-supreme может работать только с текстом и более подходит для творческого письма; Luminous-supreme-control — самая большая и наиболее дорогостоящая модель, оптимизированная для вопросно-ответных задач и вывода естественного языка.
- GPT-NeoX
Создатель: EleutherAI, некоммерческая лаборатория исследований искусственного интеллекта, изучающая большие языковые модели.
Первая публикация: февраль 2022 года
GPT-NeoX — это языковая модель с 20 миллиардами параметров, обученная на открытом языковом моделировании набора данных The Pile.
GPT-NeoX — это мощная языковая модель с небольшим числом примеров.
Несмотря на свой небольшой размер, GPT-NeoX может выполнять широкий спектр задач по пониманию языка, математике и базе знаний.
Приложения для генерации текста с использованием искусственного интеллекта
- ChatGPT
Самым известным представителем этого списка является ChatGPT от OpenAI, приложение, которое запустило волну генеративного искусственного интеллекта и ускорило его развитие. Оно привлекло внимание потребителей и работников по всему миру, открывая новые возможности для работы и создания контента.
ChatGPT может делать резюме текста, отвечать на вопросы и помогать с набором текста. Он также может помогать с вопросами по программированию и даже выполнять задачи по программированию благодаря плагину Code Interpreter, доступному через платную подписку ChatGPT Plus за 20 долларов в месяц.
С момента своего запуска в ноябре 2022 года ChatGPT был интегрирован в услуги Microsoft и Salesforce, а также набрал 8,6 миллиарда посещений с декабря 2022 года по июнь 2023 года.
- Bard
Bard — это ответ Google на ChatGPT. Созданный для конкуренции с Microsoft и OpenAI, Bard работает на основе PaLM 2, флагманской модели глубокого обучения Google.
Bard может генерировать текст, а также делать резюме документов. Он также обладает возможностью генерации кода, и пользователи могут экспортировать сгенерированный код на Python в Replit.
Чат-бот поддерживает более 40 языков.
- HuggingChat
HuggingChat был создан Hugging Face, разработчиком инструментов машинного обучения и домом для одной из крупнейших библиотек моделей искусственного интеллекта для обработки естественного языка в Интернете.
Впервые опубликованный в апреле 2023 года, HuggingChat является альтернативой с открытым исходным кодом для ChatGPT от OpenAI. Hugging Face заявил, что создал HuggingChat, чтобы сделать платформы генерации текста на основе искусственного интеллекта «прозрачными» и «ответственными».
HuggingChat работает на модифицированной версии модели LLaMA от Meta*.
Помимо текста, HuggingChat может генерировать код, хотя Hugging Face также выпустил свою собственную модель для генерации кода, StarCoder.
- Cohere
Cohere создал Cohere Command. Платформа предоставляет пользователям доступ к широкому спектру инструментов для генерации текста, включая интерактивные функции чата, создание описаний продуктов и текст для поиска и модерации контента.
Cohere предлагает бизнес-планы, и среди его пользователей такие компании, как Spotify, Oracle и Glean.
- GooseAI
GooseAI предлагает более доступную альтернативу другим платформам генерации искусственного интеллекта, утверждая, что предлагает полностью управляемый сервис NLP-as-a-Service, доступный через API по 30% стоимости традиционных поставщиков.
Пользователи GooseAI имеют доступ к ряду моделей искусственного интеллекта, использующих его инструменты. Среди них GPT-Neo 1.3B, GPT-J 6B, Fairseq 6B и GPT-NeoX.
- Flowrite
Flowrite предлагает инструменты для генерации текста для бизнес-задач, включая предложения, специально разработанные для продавцов и сотрудников отдела кадров.
Среди его пользователей такие компании, как Stripe, Snapchat, Dropbox и HBO. Его инструменты могут быть интегрированы в Outlook, Gmail и LinkedIn.
- InferKit
InferKit предлагает веб-интерфейс и API для генерации текста на основе искусственного интеллекта. Он может использоваться как разработчиками, так и сотрудниками без технических навыков.
InferKit работает на основе подписки, с уровнями, ограничивающими количество сгенерированных символов.
- Writesonic
Writesonic специализируется на генерации маркетинга, оптимизированного для поисковой системы, для блогов, онлайн-рекламы или коммерческих электронных писем.
Среди пользователей Writesonic такие компании, как TikTok, Schneider Electric и Amazon.
- Copysmith
Copysmith предлагает генератор контента на основе искусственного интеллекта для поддержки маркетинговых и коммерческих команд. Пользователи могут импортировать, например, каталоги продуктов для улучшения рабочего процесса.
В числе клиентов Copysmith указаны Target, Ocado и Marshalls. Copysmith также имеет интеграцию с Amazon, Shopify и Google Ads.
- Jasper
Jasper не только предоставляет инструменты для генерации аудио, но также предлагает возможности генерации текста на естественном языке.
Jasper предлагает генеративный API, чтобы пользователи могли внедрить инструменты в свои собственные платформы. У него также есть расширения для браузера и платформа, ориентированная на бизнес, для генерации контента.
Среди клиентов Jasper такие компании, как Airbnb, Volvo, Hubspot и HarperCollins.
- Grammarly
Grammarly — это инструмент искусственного интеллекта, который проверяет грамматику, исправляет орфографию и пунктуацию, а также предлагает советы относительно ясности контента. Он также может генерировать текст и обнаруживать плагиат.
Клиенты, такие как Zoom и Caterpillar, могут настроить Grammarly для проверки определенного стиля и тона в своем контенте.
Grammarly можно использовать через веб-браузер, как расширение в Chrome или интегрировать в приложения, такие как Microsoft Word.
*Meta признана экстремистcкой организацией в России.