Инструменты генерации голоса ElevenLabs выходят из бета-версии

ElevenLabs, вирусная платформа для создания синтетических голосов на базе искусственного интеллекта, сегодня запустила свою платформу из бета-версии с поддержкой более 30 языков.

Используя новую модель искусственного интеллекта, разработанную собственными силами, ElevenLabs говорит, что ее инструменты теперь способны автоматически идентифицировать языки, включая корейский, голландский и вьетнамский, и генерировать «эмоционально богатую» речь на этих языках.

В сочетании с новой моделью клиенты ElevenLabs могут использовать инструмент клонирования голоса платформы, чтобы говорить почти на 30 языках без предварительного ввода текста.

«ElevenLabs была основана с мечтой сделать весь контент универсально доступным на любом языке и любым голосом», — сказал генеральный директор и соучредитель ElevenLabs Мати Станишевски в своем заявлении. «С этим выпуском мы на один шаг ближе к тому, чтобы воплотить эту мечту в реальность и сделать голоса искусственного интеллекта человеческого качества доступными на каждом диалекте. Наши инструменты преобразования текста в речь помогают выровнять игровое поле и предоставить высококачественные возможности разговорного звука всем создателям».

Основанная Станишевским, который ранее работал в Palantir, и его другом детства Петром Дабковским, бывшим сотрудником Google, ElevenLabs за последние несколько месяцев попала в заголовки газет по причинам как хорошим, так и отвратительным. Вдохновленные посредственным дубляжом американских фильмов, которые Станишевский и Дабковски смотрели в детстве в Польше, пара приступила к разработке платформы, которая могла бы работать лучше — конечно, с использованием ИИ.

ElevenLabs была запущена в бета-версии в конце января и довольно быстро набрала обороты благодаря высокому качеству генерируемых голосов и щедрому бесплатному уровню. Но, как упоминалось ранее, реклама не была неизменно положительной, особенно когда злоумышленники использовали платформу в своих целях.

Печально известная доска объявлений 4chan, известная своим конспирологическим содержанием, использовала инструменты ElevenLabs, чтобы делиться ненавистническими сообщениями, имитирующими знаменитостей, таких как актриса Эмма Уотсон. Джеймс Винсент из The Verge смог использовать ElevenLabs, чтобы клонировать голоса целей за считанные секунды, создавая аудиосэмплы, содержащие все, от угроз насилия до выражений расизма и трансфобии.

В ответ ElevenLabs заявила, что представит набор новых мер безопасности, таких как ограничение клонирования голоса платными учетными записями и предоставление нового инструмента обнаружения ИИ.

Тем не менее, ElevenLabs еще предстоит разобраться с другими спорами, назревающими вокруг ее платформы и других подобных платформ: их угрозой для индустрии озвучивания.

Motherboard пишет о том, как актеров озвучивания все чаще просят отказаться от прав на свои голоса, чтобы клиенты могли использовать ИИ для создания синтетических версий, которые в конечном итоге могут их заменить. Между тем, внутренние электронные письма, с которыми ознакомилась The New York Times, указывают на то, что Activision Blizzard, один из крупнейших издателей игр в мире, работает над инструментами для «клонирования голоса» с помощью ИИ.

Судя по всему, ElevenLabs считает это естественным развитием событий, рассказывая о своей работе с такими издательствами, как Storytel, медиаплатформами TheSoul Publishing и MNTN для аудиокниг и радиоконтента, а также издательствами Embark Studios и Paradox Interactive для видеоигр. Компания утверждает, что у нее более миллиона зарегистрированных пользователей из творческих, развлекательных и издательских сфер, которые создали аудиоконтент за 10 лет.

ElevenLabs, которая недавно привлекла 19 миллионов долларов от инвесторов, в том числе Andreessen Horowitz и соучредителя DeepMind Мустафы Сулеймана, планирует в конечном итоге расширить свои модели искусственного интеллекта до голосового дубляжа, следуя по стопам таких стартапов, как Papercup и Deepdub, и создавая то, что она называет «основой для передачи эмоций и интонаций с одного языка на другой».

Помимо этого, ElevenLabs заявляет, что планирует внедрить механизм, который позволит пользователям делиться голосами на платформе, хотя детали остаются туманными.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *