От генератора текста ChatGPT до активируемого голосом Siri, инструменты, основанные на искусственном интеллекте, предназначены для облегчения нашей повседневной жизни — если вы говорите на языке, который они поддерживают. Эти технологии недоступны для миллиардов людей, которые не используют английский, французский, испанский или другие основные языки, но исследователи в Африке стремятся это изменить. В исследовании, опубликованном 11 августа в журнале Patterns, ученые намечают план разработки лучших инструментов искусственного интеллекта для африканских языков.
«Мне кажется нелогичным, что существует ограниченное количество инструментов искусственного интеллекта для африканских языков», — говорит первый автор и исследователь в области искусственного интеллекта Кэтлин Симинью из Фонда исследований Масахане, объединения африканских ученых, стремящихся создать доступные инструменты ИИ для тех, кто говорит на африканских языках. «Включение и представительство в развитии языковых технологий — это не заплатка, которую вы ставите в конце, — это то, о чем вы думаете с самого начала».
Многие из этих инструментов основаны на области ИИ под названием обработка естественного языка, технология, позволяющая компьютерам понимать человеческий язык. Компьютеры могут овладеть языком в процессе обучения, где они выявляют закономерности в речевых и текстовых данных. Однако они терпят неудачу, когда данных на конкретном языке недостаточно, как видно на примере африканских языков. Чтобы заполнить пробел, исследовательская группа сначала определила ключевых игроков, участвующих в разработке инструментов для африканских языков, и изучила их опыт, мотивацию, акценты и проблемы. К этим людям относятся писатели и редакторы, которые создают и курируют контент, а также лингвисты, инженеры-программисты и предприниматели, которые имеют решающее значение для создания инфраструктуры для языковых инструментов.
Интервью с ключевыми игроками выявили четыре основные темы, которые следует учитывать при разработке инструментов для африканских языков:
- Во-первых, в силу влияния колонизации, Африка — многоязычное общество, где африканский язык имеет центральное значение для культурной идентичности людей и является ключом к участию общества в образовании, политике, экономике и т.д.
- Во-вторых, есть необходимость поддержки создания африканского контента. Это включает в себя создание базовых инструментов, таких как словари, проверка орфографии и клавиатуры для африканских языков, а также устранение финансовых и административных барьеров для перевода государственных коммуникаций на несколько национальных языков, в том числе африканские.
- В-третьих, создание африканских языковых технологий выиграет от сотрудничества лингвистики и информатики. Также следует сосредоточиться на создании инструментов, ориентированных на человека, которые помогают людям раскрыть свой потенциал.
- В-четвертых, разработчики должны учитывать сообщества и этические практики во время сбора, обработки и использования данных.
«Все большее число организаций работает в этой области, и это исследование позволяет нам координировать усилия по созданию эффективных языковых инструментов», — говорит Симинью. «Результаты выделяют и четко формулируют приоритеты с точки зрения временных и финансовых инвестиций».
Далее команда планирует расширить исследование и включить больше участников, чтобы понять сообщества, на которые могут повлиять языковые технологии ИИ. Они также будут решать проблемы, которые могут помешать людям получить доступ к технологии. Команда надеется, что их исследование может послужить дорожной картой для разработки широкого спектра языковых инструментов, от переводческих служб до модераторов контента по выявлению дезинформации. Результаты также могут проложить путь к сохранению африканских языков коренных народов.
«Я бы хотел, чтобы мы жили в мире, где африканцы могут иметь столь же хорошее качество жизни и доступ к информации и возможностям, как и те, кто свободно владеет английским, французским, мандаринским или другими языками», — говорит Симинью.