Pocketsphinx Построить небольшую модель словарного запаса - PullRequest
1 голос
/ 27 января 2020

Я хочу построить небольшую модель словаря на немецком языке для карманного сфинкса (.lm), которая распознает только немецкие числа от 0 до 9. Используя модель Voxforge de-dede, производительность была ОЧЕНЬ плохой (почти без признания). Я попробовал TIDIGTS с похожим подходом в engli sh - который использует специализированную модель, содержащую только числа. Этот работает правильно. Поэтому мне, очевидно, нужно построить модель .lm, содержащую только мои номера - для этого я уже записал множество файлов wav и расшифровал их в необходимом формате XML. Но когда я смотрю на https://cmusphinx.github.io/wiki/tutoriallm/, как это сделать, я получаю только подсказки, как построить языковую модель с большими словарями или как использовать SRILM, что для меня совершенно бесполезно из-за ограничительных ограничений. лицензия. Так как мне построить LM из моих wav-данных?

1 Ответ

1 голос
/ 04 февраля 2020

Хорошо, это то, что я сделал: я использовал немецкую модель generic c (модель с voxforge.com), преобразовал файл .lm.bin в файл .lm с помощью sphinx_lm_convert, а затем отредактировал все, кроме номера мне нужны. Затем я использовал записанный аудиоматериал, чтобы адаптировать модель к sphinxtrain (используя sphinx_fe, bw, map-adapt). Это сейчас относительно надежно (около 80% признания). Я дополнительно реализовал ложно-положительное отклонение, изменив грамматику и словарь с помощью слова отклонения (в моем случае - ЛОЖЬ), и это также составляет до 70%.

...