Как использовать файл arpa в распознавании голоса - PullRequest
2 голосов
/ 11 сентября 2011

Я создал файл ARPA из текстового файла с помощью инструментария CMU SLM.

В настоящее время я не знаю, как использовать созданный файл ARPA в моем проекте вместо файлов .lm и .dic.

Если кто-нибудь знает об этом, пожалуйста, дайте мне знать.

1 Ответ

4 голосов
/ 05 октября 2011

Вы используете вероятность языковой модели при рассмотрении «стоимости» словоперехода в поиске.:-) но это, вероятно, не то, что вы хотели услышать.

Ваш вопрос слишком открытый ... в чем ваша конкретная проблема?

Словарь и модель языка - это два отдельных элемента- вы не можете конвертировать одно в другое.

Словарь используется, чтобы сообщить при поиске, какие слова являются действительными и как они относятся к фонемам / фонетической транскрипции.

Модель языкаиспользуется во время распознавания высказывания с использованием вероятности униграмм, биграмм, н-грамм .. когда алгоритм поиска рассматривает переход слов.

Редактировать:

проверка:

http://www -speech.sri.com / projects / srilm / manpages / ngram-format.5.html

http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html

http://www.ling.ohio -state.edu / ~ bromberg / ngramcount / ngram2fsm.html

...