Обновление голосовых данных Mozilla Common Voice 20 — AllUNIX.ru — Всероссийский портал о UNIX-системах

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 32.6 до 33.1 тысячи часов речи, из которых 22.1 тысячи часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 129 до 133 — добавлены языки арагонский, исиндебеле, южный сото и тупури.

В подготовке материалов на английском языке приняли участие 94.9 тысяч человек, надиктовавших 3631 час речи (было 93.9 тысячи участников и 3587 часов). Набор для белорусского языка охватывает 8521 участника и 1860 часов речевого материала (было — 8444 участников и 1846 часов), русского языка — 3365 участников и 281 час (было 3296 участников и 278 часов), узбекского — 2211 участников и 265 часов (было 2200 участников и 265 часов), украинского языка — 1120 участника и 114 часов (было 1104 участник и 114 часов).

Проект Common Voice организует совместную работу по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи без ограничений можно использовать в системах машинного обучения и в исследовательских проектах.

Источник: http://www.opennet.ru/opennews/art.shtml?num=62413