Обновление голосовых данных Mozilla Common Voice 14.0
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 27.1 до 28.1 тысяч часов речи, из которых 18.6 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 108 до 112 (добавлены пушту, албанский, амхарский и стандартный марокканский берберский языки). В подготовке материалов на английском языке приняли участие 88.1 тысяча человек, надиктовавших 3279 часов речи (было 88 тысяч участников и 3161 … Читать далее Обновление голосовых данных Mozilla Common Voice 14.0