Компания Elicit создает инструмент для автоматизации обзора научной литературы

Для исследователей чтение научной литературы может отнимать огромное количество времени. По данным одного исследования, ученые тратят на поиск информации семь часов в неделю. По данным другого исследования, систематические обзоры литературы — научные обобщения фактических данных по определенной теме — занимают в среднем 41 неделю у исследовательской группы из пяти человек.

Но так не должно быть. По крайней мере, так считает Андреас Штульмюллер, соучредитель компании Elicit, занимающейся разработкой «помощника исследователя» для ученых и научно-исследовательских лабораторий. Компания Elicit, в число спонсоров которой входят Fifty Years, Basis Set, Illusion, а также бизнес-ангелы Джефф Дин (главный научный сотрудник Google) и Томас Эбелинг (бывший генеральный директор Novartis), создает инструмент на базе ИИ, позволяющий абстрагироваться от наиболее утомительных аспектов анализа литературы.

«Elicit — это исследовательский помощник, автоматизирующий научные исследования с помощью языковых моделей», — сказал Штульмюллер. «В частности, он автоматизирует обзор литературы, находя релевантные статьи, извлекая ключевую информацию об исследованиях и организуя ее в концепции».

Elicit — это коммерческое предприятие, созданное на базе некоммерческого исследовательского фонда Ought, основанного в 2017 году Штульмюллером, бывшим научным сотрудником лаборатории вычислений и познания Стэнфорда. Другой соучредитель Elicit, Джунгвон Бьюн, пришел в стартап в 2019 году после того, как возглавил рост компании Upstart, занимающейся онлайн-кредитованием.

Используя различные модели, как собственные, так и сторонние, Elicit осуществляет поиск и обнаружение концепций в различных работах, позволяя пользователям задавать вопросы типа «Каковы все эффекты креатина?» или «Какие наборы данных использовались для изучения логических рассуждений?» и получать список ответов из научной литературы.

«Автоматизировав процесс систематического обзора, мы можем сразу же обеспечить экономию средств и времени для академических и промышленных исследовательских организаций, готовящих такие обзоры», — сказал Штульмюллер. «Снизив затраты, мы открываем новые возможности использования, которые ранее были нерентабельными, например, своевременное обновление информации при изменении состояния знаний в той или иной области».

Но разве языковые модели не склонны к выдумыванию? Действительно, склонны. Попытка компании Meta* создать языковую модель для оптимизации научных исследований — Galactica — была удалена всего через три дня после запуска, когда выяснилось, что модель часто ссылается на фальшивые научные работы, которые звучат правильно, но на самом деле не соответствуют действительности.

Штульмюллер утверждает, что компания Elicit приняла меры для обеспечения большей надежности своего ИИ, чем многие из существующих специализированных платформ.

Например, Elicit разбивает на «понятные человеку» части сложные задачи, которые выполняют его модели. Это позволяет Elicit, например, определить, как часто различные модели ошибаются при составлении резюме, и впоследствии помочь пользователям определить, какие ответы следует проверять и когда.

Elicit также пытается вычислить общую «достоверность» научной статьи, принимая во внимание такие факторы, как контролируемость или рандомизация проведенных исследований, источник финансирования и возможные конфликты, а также размер исследований.

«Мы не делаем чат-интерфейсов», — говорит Штульмюллер. «Пользователи Elicit применяют языковые модели как пакетные задания… Мы не просто генерируем ответы с помощью моделей, мы всегда связываем ответы с научной литературой, чтобы уменьшить галлюцинации и облегчить проверку работы моделей».

Есть сомнения, что Elicit решила некоторые из основных проблем, стоящих сегодня перед языковыми моделями, учитывая их трудноразрешимость. Но ее усилия, безусловно, вызвали интерес — и, возможно, даже доверие — со стороны исследовательского сообщества.

Штульмюллер утверждает, что ежемесячно Elicit используют более 200 000 человек, что означает трехкратный рост в годовом исчислении (начиная с января 2023 г.), среди которых такие организации, как Всемирный банк, Genentech и Стэнфорд. «Наши пользователи хотят платить за более мощные функции и использовать Elicit в более крупных масштабах», — добавил он.

Предположительно, именно этот импульс привел к первому раунду финансирования Elicit — траншу в размере 9 млн. долл. под руководством компании Fifty Years. Основную часть полученных средств планируется направить на дальнейшее развитие продукта Elicit, а также на расширение команды менеджеров по продуктам и инженеров-программистов.

Но как Elicit собирается зарабатывать деньги? Штульмюллер указал на платный уровень Elicit, запущенный на этой неделе, который позволяет пользователям осуществлять поиск статей, извлекать данные и обобщать концепции в более широком масштабе, чем тот, который поддерживает бесплатный уровень. Долгосрочная стратегия заключается в том, чтобы превратить Elicit в общий инструмент для исследований и рассуждений — такой, за который будут платить целые предприятия.

Одним из возможных препятствий на пути к коммерческому успеху Elicit являются такие проекты с открытым исходным кодом, как Open Language Model Института ИИ Аллена, целью которых является разработка бесплатной большой языковой модели, оптимизированной для науки. Однако Штульмюллер считает, что открытый исходный код скорее является дополнением, чем угрозой.

«Основную конкуренцию сейчас составляет человеческий труд — научные ассистенты, которых нанимают для кропотливого извлечения данных из статей», — говорит Штульмюллер. «Научные исследования — это огромный рынок, а инструменты для организации рабочего процесса исследований не имеют серьезных конкурентов. Именно здесь мы увидим появление совершенно новых рабочих процессов, основанных на искусственном интеллекте».

*Meta признана экстремистcкой организацией в России.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *