Обновление голосовых данных Mozilla Common Voice 8.0
Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч людей. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился на 30% — с 13.9 до 18.2 тысяч часов речи. Число поддерживаемых языков возросло с 67 до 87. Набор для русского языка охватывает 2452 участника и 193 часа речевого материала (было 2136 участников и 173 часов), для белорусского языка — 6160 участников и 987 часов (было — 3831 участник и 356 часов), … Читать далее Обновление голосовых данных Mozilla Common Voice 8.0
