Пионер ИИ говорит, что общественные дискуссии об умных машинах должны оказывать «должное уважение к человеческой деятельности»

Она — одна из важных фигур, стоящих за современным бумом искусственного интеллекта, но не все ученые-компьютерщики считали, что Фей-Фей Ли была на верном пути, когда ей пришла в голову идея создания гигантской визуальной базы данных под названием ImageNet, на построение которой были потрачены годы.

Ли, которая сейчас является директором-основателем Стэнфордского института искусственного интеллекта, ориентированного на человека, выпустила новые мемуары, в которых рассказывает о своей новаторской работе по созданию базы данных, ускорившей развитие компьютерного зрения в области искусственного интеллекта.

Книга «Мир, который я вижу (The World I See)» также рассказывает о годах ее становления, когда она внезапно переехала из Китая в Нью-Джерси и прошла через академические круги, Кремниевую долину и залы Конгресса, когда растущая коммерциализация технологий ИИ привлекла внимание общественности и вызвала негативную реакцию. В беседе с Ассошиэйтед Пресс она рассказала о книге и текущем моменте в области ИИ. Интервью было отредактировано для большей ясности и объема.

Вопрос: В вашей книге описывается, как вы представляли себе ImageNet как нечто большее, чем просто огромный набор данных. Не могли бы вы пояснить?

Ответ: ImageNet — это пример типичной истории определения Полярной звезды проблемы ИИ, а затем поиска пути к ней. Для меня Полярной звездой стало переосмысление того, как мы можем решить проблему визуального интеллекта. Одна из самых фундаментальных проблем визуального интеллекта — это понимание, или видение, объектов, потому что мир состоит из объектов. Человеческое зрение основано на нашем понимании объектов. А их много, много, много. ImageNet — это попытка определить проблему распознавания объектов, а также предложить путь к ее решению, а это путь больших данных.

Вопрос: Если бы я мог перенестись на 15 лет назад, когда вы усердно работали над ImageNet, и рассказать вам о DALL-E, Stable Diffusion, Google Gemini и ChatGPT — что бы вас больше всего удивило?

Ответ: Что меня не удивляет, так это то, что все, что вы упомянули — DALL-E, ChatGPT, Gemini — основано на больших данных. Они проходят предварительное обучение на большом количестве данных. Это именно то, на что я рассчитывала. Что меня удивило, так это то, что мы добрались до генеративного ИИ быстрее, чем многие из нас думали. Генерация для людей на самом деле не так проста. Большинство из нас не являются прирожденными художниками. Легче всего генерировать слова, потому что речь — это генеративный процесс, но рисование и живопись не являются генеративными для обычных людей. Нам нужны Ван Гоги нашего мира.

Вопрос: Как вы думаете, чего большинство людей хотят от умных машин, и совпадает ли это с тем, что создают ученые и технологические компании?

Ответ: Я думаю, что в основном люди хотят достоинства и хорошей жизни. Это почти основополагающий принцип нашей страны. Машины и технологии должны соответствовать универсальным человеческим ценностям — достоинству и лучшей жизни, включая свободу и все эти вещи. Иногда, когда мы говорим о технологиях или иногда, когда мы создаем технологии, намеренно или ненамеренно, мы недостаточно говорим об этом. Когда я говорю «мы», это включает в себя технологов, бизнес, но также и журналистов. Это наша коллективная ответственность.

Вопрос: Каковы самые большие заблуждения об ИИ?

Ответ: Самое большое заблуждение относительно ИИ в журналистике — это когда журналисты используют субъект ИИ и глагол и ставят человека в качестве объекта. Человеческая деятельность очень и очень важна. Мы создаем технологии, мы внедряем технологии и мы управляем технологиями. Средства массовой информации и общественный дискурс, но в значительной степени под влиянием СМИ, говорят об ИИ без должного уважения к человеческому участию. У нас так много статей, так много дискуссий, которые начинаются с «ИИ приносит бла-бла-бла; ИИ делает бла-бла-бла; ИИ обеспечивает бла-бла-бла; ИИ уничтожает бла-бла-бла». И я думаю, нам нужно это признать.

Вопрос: До того как заняться компьютерным зрением, вы изучали нейронауку, насколько процессы ИИ отличаются или похожи на человеческий интеллект?

Ответ: Поскольку я уже знакома с нейронаукой, я еще больше понимаю, насколько они отличаются друг от друга. Мы не знаем всех тонкостей того, как мыслит наш мозг. Мы имеем некоторое представление о визуальных задачах низшего уровня, таких как восприятие цвета и форм. Но мы не знаем, как люди пишут Шекспира, как приходят к любви, как проектируют мост «Золотые ворота». В науке о человеческом мозге так много сложностей, которые до сих пор остаются загадкой. Мы не знаем, как мы делаем это, потребляя менее 30 ватт энергии, которую использует мозг. Почему мы так ужасны в математике, в то время как мы так быстро видим, ориентируемся и манипулируем физическим миром? Мозг — бесконечный источник вдохновения для того, каким должен быть и что должен делать искусственный интеллект. Его нейронная архитектура — (нейрофизиологи Хьюбел и Визель, лауреаты Нобелевской премии) стали ее первооткрывателями — стала источником вдохновения для искусственных нейронных сетей. Мы позаимствовали эту архитектуру, хотя с математической точки зрения она не полностью повторяет то, что делает мозг. Существует множество переплетений. Но мы также должны учитывать, что есть много неизвестного, поэтому трудно ответить, насколько они похожи.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *