Исследователи взвешивают плюсы и минусы Code Interpreter для ChatGPT, и ожидают обновлений

Хотя исследователи из Университета Западной Вирджинии видят потенциал в образовательных учреждениях для новейшего официального плагина ChatGPT под названием Code Interpreter, они обнаружили ограничения для его использования учеными, которые работают с биологическими данными, применяя вычислительные методы для выявления приоритетных направлений лечения рака и генетических заболеваний.

«Code Interpreter — это хорошо и полезно в образовательных целях, поскольку он делает программирование в области STEM более доступным для студентов», — сказал Гангцин «Майкл» Ху, доцент кафедры микробиологии, иммунологии и клеточной биологии Медицинской школы Университета Западной Вирджинии и директор Центра биоинформатики.

«Однако в нем нет функций, необходимых для биоинформатики. Это технические проблемы, которые могут быть преодолены. Будущие разработки Code Interpreter, вероятно, расширят его использование на многие области, такие как биоинформатика, финансы и экономика».

С момента выпуска в декабре 2022 года популярный чат-бот искусственного интеллекта ChatGPT привлек внимание бизнеса, образовательных учреждений и широкой общественности. Однако он не совсем соответствовал потребностям людей, работающих в области биомедицинских исследований, включая биоинформатику — область, где информатика встречается с биологией, — которые с нетерпением ждали плагина Code Interpreter от OpenAI в надежде, что он заполнит пробелы.

Ху и его команда протестировали Code Interpreter на различных задачах, чтобы оценить его возможности. Их выводы, опубликованные в журнале Annals of Biomedical Engineering, показывают, что плагин снимает некоторые барьеры, но не все.

Например, люди без научного образования получат легкий доступ к программированию или компьютерному кодированию с помощью Code Interpreter. Ху сказал, что он также является экономически эффективным и вызывает любопытство у студентов исследовать анализ данных и повышает их интерес к обучению. Он указывает, однако, что пользователям потребуется понимание того, как интерпретировать данные и распознавать, являются ли результаты точными, а также знать, как взаимодействовать с чат-ботом.

Биоинформатики полагаются на точное кодирование, компьютерные программы и доступ в Интернет для хранения, анализа и интерпретации биологических данных, таких как ДНК и геном человека, которые используются для достижений в современной медицине.

Несмотря на необходимость улучшений, специфических для биоинформатики, Ху сказал, что Code Interpreter помогает пользователям определить, является ли ответ точным или это вымышленный ответ, представленный с уверенностью, известный как галлюцинация.

«Люди знают, что ChatGPT может делать много впечатляющих вещей, но он плох в предоставлении ссылки или справки в поддержку своего ответа. Если его спросить об источнике, подтверждающем утверждение ответа, он может начать придумывать ссылки», — объяснил Ху. «Code Interpreter предлагает решение для минимизации галлюцинаций. Для вопросов, которые могут быть решены с помощью программирования, сам код служит источником или ссылкой. Это значительный шаг вперед».

Вместе с Ху работали Лэй Ван, постдокторант кафедры микробиологии, иммунологии и клеточной биологии Университета Западной Вирджинии; Сийцзинь Гэ из Университета Южной Дакоты; и Ли Лю из Университета штата Аризона.

Команда обнаружила положительные результаты в способности Code Interpreter преобразовывать данные в диаграммы и графики.

Предложения по модернизации Code Interpreter включают доступ в Интернет для загрузки геномных данных, установку программного обеспечения, специфичного для биоинформатики, расширение емкости хранения и поддержку дополнительных языков программирования. Кроме того, исследователи обнаружили необходимость в приложениях конфиденциальности и безопасности для соблюдения таких нормативов, как HIPAA.

При тестировании анализа данных они обнаружили несколько ограничений. Плагин поддерживает только Python, и немногие из его программных пакетов предназначены для биоинформатики. Кроме того, он не позволяет получить доступ к данным из Интернета и не имеет возможности работать с большими файлами.

«Он позволяет работать со 100 мегабайтами или около того, но файлы, с которыми мы работаем, находятся на уровне гигабайта», — объяснил Ху. «Кроме того, он не поддерживает параллельную обработку, необходимую для больших наборов данных, что приводит к медленной производительности».

Ху сказал, что, хотя он ожидает дальнейших обновлений для Code Interpreter, он планирует помочь студентам лучше узнать о преимуществах текущего плагина.

«В своем классе в следующем семестре я планирую представить этот плагин, чтобы помочь студентам изучить визуализацию данных», — сказал Ху. «Искусственный интеллект — быстро развивающаяся область. Я надеюсь, что к тому времени OpenAI, возможно, преодолеет некоторые ограничения, чтобы его можно было использовать для широкого спектра биоинформатического программирования».

В начале этого года Ху возглавил еще одно исследование, чтобы подготовить учеников старших классов и студентов колледжей к использованию потенциала ChatGPT, изучая больше о программировании. В процессе использовался OPTIMAL — Оптимизация подсказок через итеративное наставничество и оценку — для улучшения общения с чат-ботом.

В долгосрочной перспективе Ху сказал, что он продолжит отслеживать и тестировать новые программы искусственного интеллекта и функции.

«По мере разработки новых продуктов я буду продолжать», — сказал Ху. «Определенно много других инновационных возможностей ожидают своего открытия».

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *