Дорожная карта для помощи технологиям искусственного интеллекта в овладении африканскими языками

От генератора текста ChatGPT до активируемого голосом Siri, инструменты, основанные на искусственном интеллекте, предназначены для облегчения нашей повседневной жизни — если вы говорите на языке, который они поддерживают. Эти технологии недоступны для миллиардов людей, которые не используют английский, французский, испанский или другие основные языки, но исследователи в Африке стремятся это изменить. В исследовании, опубликованном 11 августа в журнале Patterns, ученые намечают план разработки лучших инструментов искусственного интеллекта для африканских языков.

«Мне кажется нелогичным, что существует ограниченное количество инструментов искусственного интеллекта для африканских языков», — говорит первый автор и исследователь в области искусственного интеллекта Кэтлин Симинью из Фонда исследований Масахане, объединения африканских ученых, стремящихся создать доступные инструменты ИИ для тех, кто говорит на африканских языках. «Включение и представительство в развитии языковых технологий — это не заплатка, которую вы ставите в конце, — это то, о чем вы думаете с самого начала».

Многие из этих инструментов основаны на области ИИ под названием обработка естественного языка, технология, позволяющая компьютерам понимать человеческий язык. Компьютеры могут овладеть языком в процессе обучения, где они выявляют закономерности в речевых и текстовых данных. Однако они терпят неудачу, когда данных на конкретном языке недостаточно, как видно на примере африканских языков. Чтобы заполнить пробел, исследовательская группа сначала определила ключевых игроков, участвующих в разработке инструментов для африканских языков, и изучила их опыт, мотивацию, акценты и проблемы. К этим людям относятся писатели и редакторы, которые создают и курируют контент, а также лингвисты, инженеры-программисты и предприниматели, которые имеют решающее значение для создания инфраструктуры для языковых инструментов.

Интервью с ключевыми игроками выявили четыре основные темы, которые следует учитывать при разработке инструментов для африканских языков:

  • Во-первых, в силу влияния колонизации, Африка — многоязычное общество, где африканский язык имеет центральное значение для культурной идентичности людей и является ключом к участию общества в образовании, политике, экономике и т.д.
  • Во-вторых, есть необходимость поддержки создания африканского контента. Это включает в себя создание базовых инструментов, таких как словари, проверка орфографии и клавиатуры для африканских языков, а также устранение финансовых и административных барьеров для перевода государственных коммуникаций на несколько национальных языков, в том числе африканские.
  • В-третьих, создание африканских языковых технологий выиграет от сотрудничества лингвистики и информатики. Также следует сосредоточиться на создании инструментов, ориентированных на человека, которые помогают людям раскрыть свой потенциал.
  • В-четвертых, разработчики должны учитывать сообщества и этические практики во время сбора, обработки и использования данных.

«Все большее число организаций работает в этой области, и это исследование позволяет нам координировать усилия по созданию эффективных языковых инструментов», — говорит Симинью. «Результаты выделяют и четко формулируют приоритеты с точки зрения временных и финансовых инвестиций».

Далее команда планирует расширить исследование и включить больше участников, чтобы понять сообщества, на которые могут повлиять языковые технологии ИИ. Они также будут решать проблемы, которые могут помешать людям получить доступ к технологии. Команда надеется, что их исследование может послужить дорожной картой для разработки широкого спектра языковых инструментов, от переводческих служб до модераторов контента по выявлению дезинформации. Результаты также могут проложить путь к сохранению африканских языков коренных народов.

«Я бы хотел, чтобы мы жили в мире, где африканцы могут иметь столь же хорошее качество жизни и доступ к информации и возможностям, как и те, кто свободно владеет английским, французским, мандаринским или другими языками», — говорит Симинью.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *