Во всех неистовых дискуссиях о больших языковых моделях (LLM), таких как GPT-4, есть один момент, с которым, похоже, согласны все: эти модели, по сути, являются стохастическими попугаями — то есть машинами, которые хорошо генерируют убедительные предложения, но на самом деле не понимают смысла обрабатываемого ими языка. Они каким-то образом «прочитали» (то есть проглотили) все, что когда-либо было опубликовано в машиночитаемой форме, и создают предложения слово за словом, в каждый момент времени делая статистическое предположение о том, «что можно было бы ожидать от человека, увидев, что люди написали на миллиардах веб-страниц и т.д.». Вот и все!
С тех пор как в ноябре прошлого года появился ChatGPT, люди не перестают удивляться возможностям этих попугаев — насколько они похожи на людей и т.д. Но поначалу утешением служила мысль о том, что раз модели опираются только на то, что уже хранится в их емкой памяти, то они не могут быть по-настоящему оригинальными: они будут просто повторять общепринятую мудрость, заложенную в их обучающих данных. Однако эта успокаивающая мысль продержалась недолго: экспериментаторы продолжали находить удивительные и непредсказуемые особенности поведения LLM, которые теперь называют «эмерджентными способностями».
С самого начала многие люди использовали LLM в качестве вспомогательного средства для проведения мозгового штурма. Попросите одну из них назвать пять способов сокращения выбросов углекислого газа в атмосферу, и она предложит целый список разумных и выполнимых предложений. Таким образом, очевидно, что сочетание «человек плюс LLM» может быть творческим партнерством. Но, конечно, нам хотелось бы знать, способны ли машины сами по себе к творчеству?
Но разве творчество не является скользким понятием — чем-то, что трудно определить, но что мы, тем не менее, узнаем, когда видим его? Однако это не помешало психологам попытаться измерить его с помощью таких инструментов, как тест альтернативного использования и аналогичный тест Торренса. И оказалось, что одна из LLM — GPT-4 — выигрывает у 91% людей в первом случае и у 99% — во втором. Так что, по словам заядлого пользователя искусственного интеллекта Итана Моллика, мы исчерпали возможности тестов на креативность: «У нас заканчиваются тесты на креативность, с которыми ИИ не может справиться».
Моллик работает в Уортонской школе бизнеса при Пенсильванском университете и с самого начала был сторонником LLM. Некоторые из его коллег провели эксперимент с GPT-4 и 200-ми своими студентами, поставив перед человеком и машиной одну и ту же задачу: придумать идею для продукта, ориентированного на американских студентов, который продавался бы в розницу по цене менее 50 долларов.
И каковы результаты? «ChatGPT-4 предложила больше, более дешевых и лучших идей, чем студенты. Еще более впечатляющим, с точки зрения бизнеса, оказалось то, что у внешних экспертов намерение купить товар, было выше для идей, сгенерированных ИИ! Из 40 лучших идей, оцененных судьями, 35 были получены от ChatGPT».
Однако действительно интересным аспектом исследования стал вывод, сделанный исследователями об его экономической стороне. «Профессионал, работающий с ChatGPT-4, — пишут они, — может генерировать идеи со скоростью около 800 идей в час. При стоимости часа человеческих усилий в $500 — цифра, представляющая собой оценку полной загрузки квалифицированного специалиста, — идеи генерируются по цене около $0,63 за каждую… В то время, когда мы использовали ChatGPT-4, плата за API (интерфейс прикладного программирования, позволяющий двум или более компьютерным программам взаимодействовать друг с другом) для 800 идей составляла около $20. За те же 500 долларов в час человек, работающий один, без помощи LLM, генерирует только 20 идей, затрачивая на каждую примерно 25 долларов… Таким образом, для решения задачи целенаправленной генерации идей человек, использующий ChatGPT-4, примерно в 40 раз более продуктивен, чем человек, работающий один».
Если вы хотите получить представление о том, как корпорации будут относиться к этой технологии, то лучше этого ничего не придумаешь. Прочитанное заставляет вспомнить проницательное эссе Теда Чианга в журнале New Yorker о том, как на самом деле будет использоваться ИИ. «Я предлагаю, — пишет он, — думать об ИИ как об управленческой консалтинговой фирме, наподобие McKinsey & Company. Такие фирмы, как McKinsey, нанимают по самым разным причинам, и системы искусственного интеллекта тоже используются по многим причинам. Но сходство между McKinsey — консалтинговой фирмой, работающей с 90% компаний из списка Fortune 100, — и искусственным интеллектом также очевидно».
Если вы являетесь руководителем высшего звена, которому приходится принимать неприятные решения, но при этом требуется правдоподобное оправдание, то возможность сослаться на внешнего консультанта — или новую технологию? — это хороший способ сделать это. Поэтому, считает Чианг, по мере того как ИИ становится все более мощным и гибким, мы должны задаться вопросом: есть ли способ не допустить, чтобы он стал еще одной версией McKinsey? Чтобы узнать ответ, достаточно задать этот вопрос.