Microsoft усердно работает над доказательством «интеллектуальной» части в искусственном интеллекте и только что представила последнюю версию своей серии моделей искусственного интеллекта Turing Bletchley — Turing Bletchley v3.
Как объясняется в официальной блог-записи, Turing Bletchley v3 — это многоязычная зрительно-языковая базовая модель, которая будет интегрирована во многие существующие продукты Microsoft.
Часть «многоязычная», в описании модели, говорит сама за себя – модель помогает продуктам Microsoft функционировать на ряде языков, в настоящее время их более девяноста. Часть «зрительно-языковая» означает, что модель одновременно обладает возможностями обработки изображений и языка, поэтому такой тип модели называется «мультимодальным». Наконец, часть «базовая модель» относится к концептуальной и технической структуре самой модели.
Первая версия этой мультимодальной модели была запущена в ноябре 2021 года, а в 2022 году Microsoft начал тестировать последнюю версию — v3. Turing Bletchley v3 впечатляет тем, что создание модели, которая может «понимать» один тип входных данных (скажем, текст или изображения), уже является большой работой. Эта модель объединяет обработку как текста, так и изображений, чтобы в случае с Bing улучшить результаты поиска.
Модель Turing Bletchley v3 использует концепцию нейронных сетей, которая представляет собой способ программирования машины, имитирующий работу человеческого мозга. Эти нейронные сети позволяют ей устанавливать связи следующим образом, как описывает сам Microsoft:
«Дано изображение и подпись, описывающая изображение, некоторые слова в подписи замаскированы. Затем нейронная сеть обучается предсказывать скрытые слова с учетом изображения и текста. Задача также может быть перевернута, чтобы вместо слов маскировать пиксели».
Модель обучается таким образом многократно, что мало чем отличается от того, как мы учимся. Разработчики Microsoft также постоянно контролируют модель и улучшают ее.
Поиск Bing — не единственный продукт, который был модернизирован с помощью Turing Bletchley v3. Она также используется для модерации контента в игровом сервисе Microsoft Xbox Live. Модель помогает команде модераторов Xbox идентифицировать неуместный и вредный контент, загруженный пользователями Xbox в свои профили.
Модерация контента — это огромная работа по масштабу и часто психологически изнурительная, поэтому любая помощь, которая позволяет модераторам фактически видеть меньше тревожного контента, — это большая победа.
Похоже, это значительное улучшение для поиска Bing. Между Microsoft и Google разгорается борьба в использовании искусственного интеллекта. Недавно Microsoft добавил ИИ Bing в Google Chrome, а теперь он появился и в поиске изображений. Непонятно почему Google не рассматривает это как прямую конкуренцию в самой прямой форме. Google по-прежнему пользуется наибольшей популярностью как в плане браузера, так и по объему поиска, но ничто не является незыблемым.