На мероприятии Microsoft Ignite 2023 компания представила инструмент для создания дипфейков

Одним из самых неожиданных продуктов, представленных на мероприятии Microsoft Ignite 2023, стал инструмент, позволяющий создавать фотореалистичный аватар человека и анимировать его, чтобы он произносил то, что человек не обязательно говорил.

Новая функция — преобразующий текст в речь аватар Azure AI Speech, доступная сегодня в общедоступной предварительной версии, позволяет пользователям создавать видеоролики с говорящим аватаром, загружая изображения человека, на которого они хотят, чтобы аватар был похож, и составляя сценарий. Инструмент Microsoft обучает модель анимации, а отдельная модель преобразования текста в речь — либо заранее созданная, либо обученная по голосу человека — «читает» сценарий вслух.

«С помощью аватара с преобразованием текста в речь пользователи могут более эффективно создавать видео… создавать обучающие видеоролики, презентации продуктов, отзывы клиентов (и т.д.), просто вводя текст», — пишет Microsoft в своем блоге. «Аватар можно использовать для создания разговорных агентов, виртуальных помощников, чат-ботов и т.д.».

Аватары могут говорить на нескольких языках. А в сценариях чат-ботов они могут использовать модели искусственного интеллекта, такие как GPT-3.5 от OpenAI, чтобы отвечать на вопросы клиентов, задаваемые не по сценарию.

В настоящее время существует бесчисленное множество способов злоупотребления таким инструментом, что, к чести Microsoft, компания осознает. По словам представителей Microsoft, большинство подписчиков Azure смогут получить доступ только к готовым аватарам, а не к пользовательским. Пользовательские аватары в настоящее время являются функцией «ограниченного доступа», доступной только при регистрации и «только для определенных случаев использования».

Однако эта функция вызывает целый ряд неудобных этических вопросов.

Одним из основных спорных моментов в недавней забастовке SAG-AFTRA было использование искусственного интеллекта для создания цифровых образов. В конечном итоге студии согласились платить актерам за их сгенерированные искусственным интеллектом образы. Но как быть с Microsoft и ее клиентами?

На вопрос позиции Microsoft в отношении компаний, использующих сходства актеров без, по мнению актеров, соответствующей компенсации или даже без уведомления, компания не ответила, равно как и не сообщила, будет ли она требовать от компаний маркировать аватары как созданные искусственным интеллектом, как это делает YouTube и все большее число других платформ.

Персональный голос

Microsoft, судя по всему, имеет больше гарантий в отношении родственного инструмента генеративного ИИ — персонального голоса, который также представлен на конференции Microsoft Ignite 2023.

Персональный голос — новая возможность в рамках собственной нейронной голосовой службы Microsoft — может воспроизвести голос пользователя за несколько секунд, используя в качестве звуковой подсказки одноминутный образец речи. Microsoft предлагает использовать эту функцию для создания персонализированных голосовых помощников, дублирования контента на разные языки и создания индивидуальных дикторских текстов для рассказов, аудиокниг и подкастов.

Чтобы избежать возможных юридических проблем, Microsoft требует от пользователей «явного согласия» в виде записанного заявления, прежде чем клиент сможет использовать личный голос для синтеза голоса. На данный момент доступ к этой функции закрыт регистрационной формой, и пользователи должны согласиться использовать персональный голос только в тех приложениях, «где голос не читает пользовательский или открытый контент».

«Использование голосовой модели должно оставаться внутри приложения, а выходные данные не должны публиковаться или распространяться из приложения», — пишет Microsoft в своем блоге. «Клиенты, отвечающие критериям ограниченного доступа, сохраняют единоличный контроль над созданием, доступом и использованием голосовых моделей и их выходных данных (если это касается) дублирования фильмов, телевидения, видео и аудио только в развлекательных сценариях».

Компания Microsoft не ответила на вопросы о том, каким образом актеры могут получать вознаграждение за свои личные голосовые данные, а также о том, планирует ли она внедрять какие-либо технологии водяных знаков, чтобы голоса, созданные искусственным интеллектом, можно было легче идентифицировать.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *