Исследование: люди не могут обнаружить более четверти образцов речи, сгенерированной ИИ

Новое исследование Университетского колледжа Лондона показало, что люди смогли обнаружить искусственно сгенерированную речь только в 73% случаев, причем точность была одинаковой как для английского, так и для мандаринского языков.

Это исследование, опубликованное в PLOS ONE, стало первым, оценивающим способность людей обнаруживать искусственно сгенерированную речь на языке, отличном от английского.

Дипфейки — это синтетические медиа, призванные имитировать голос или внешность реального человека. Они относятся к категории генеративного искусственного интеллекта (ИИ), типа машинного обучения (ML), который тренирует алгоритм для изучения шаблонов и характеристик набора данных, таких как видео или аудио реального человека, чтобы воспроизводить оригинальные звуки или изображения.

В то время как ранние алгоритмы синтеза речи требовали тысяч образцов голоса человека, чтобы сгенерировать оригинальное аудио, последние предобученные алгоритмы могут воссоздать чей-то голос, используя всего трехсекундный фрагмент речи этого человека. Открытые алгоритмы свободно доступны, и хотя некоторый опыт был бы полезен, отдельному человеку было бы вполне по силам обучить их в течение нескольких дней.

Недавно компания Apple анонсировала программное обеспечение для iPhone и iPad, которое позволяет пользователю создать копию своего голоса, используя 15 минут записей.

Исследователи из Университетского колледжа Лондона использовали алгоритм синтеза речи по тексту (TTS), обученный на двух открытых наборах данных, один на английском, другой на мандаринском языках, чтобы сгенерировать по 50 образцов синтезированной речи на каждом языке. Эти образцы отличались от тех, которые использовались для обучения алгоритма, чтобы избежать возможности воспроизведения его исходных данных.

Эти искусственно сгенерированные образцы и подлинные образцы были представлены 529 участникам, чтобы посмотреть, смогут ли они отличить настоящую речь от поддельной. Участники смогли идентифицировать поддельную речь только в 73% случаев, эффективность немного улучшилась после того, как они прошли тренировку по распознаванию аспектов синтезированной речи.

Кимберли Май (UCL Computer Science), первый автор исследования, сказала: «Наши результаты подтверждают, что люди не могут надежно обнаруживать синтезированную речь, прошли они тренировку по распознаванию искусственного контента или нет. Стоит также отметить, что образцы, которые мы использовали в этом исследовании, были созданы с помощью алгоритмов, которые относительно устарели, что ставит вопрос — смогли бы люди еще хуже обнаруживать синтезированную речь, созданную с использованием самых современных технологий, доступных сейчас и в будущем».

Следующий шаг для исследователей — разработка более совершенных автоматизированных детекторов речи в рамках постоянных усилий по созданию возможностей обнаружения, противодействующих угрозе искусственно сгенерированного аудио и изображений.

Хотя есть преимущества от технологий генеративного ИИ, такие как большая доступность для тех, чья речь может быть ограничена или кто может потерять голос из-за болезни, растут опасения, что такая технология может быть использована преступниками и государствами для нанесения значительного вреда отдельным людям и обществам.

Задокументированы случаи использования синтезированной речи преступниками, включая один инцидент 2019 года, когда генерального директора британской энергетической компании убедили перевести сотни тысяч фунтов стерлингов ложному поставщику с помощью поддельной записи голоса его босса.

Профессор Льюис Гриффин (UCL Computer Science), старший автор исследования, сказал: «По мере того, как технологии генеративного ИИ становятся более сложными, а многие из этих инструментов открыты и доступны, мы находимся на пороге появления многочисленных преимуществ и рисков. Было бы разумно, чтобы правительства и организации разработали стратегии борьбы со злоупотреблением этими инструментами, но мы также должны признать позитивные возможности, которые появляются на горизонте».

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *