concertzaal

Яндекс завёз в Браузер новую систему голосового перевода — теперь англоязычные спикеры звучат по-русски, но своими голосами. С той же интонацией, тембром и темпом речи. Технически это — результат глобальной оптимизации генеративного синтеза. Коротко для тех, кто хочет залезть под капот: заменили BPE-токены на фонемы для лучшей точности произношения → добавили встроенную биометрию, чтобы считывать тембр → решили проблему акцента с помощью параллельного синтетического датасета: раньше он слышался в 50% случаев, теперь — в 5% → разогнали модель для реалтайма (RTF – 0.18) → и финальный штрих — управляемость синтеза через UTMOS на значении 3.75. Потестить можно в Яндекс Браузере — на YouTube, VK Видео, Дзене, Rutube и в поиске Яндекса. @concertzaal