Я создал файл ARPA из текстового файла с помощью инструментария CMU SLM.
В настоящее время я не знаю, как использовать созданный файл ARPA в моем проекте вместо файлов .lm и .dic.
.lm
.dic
Если кто-нибудь знает об этом, пожалуйста, дайте мне знать.
Вы используете вероятность языковой модели при рассмотрении «стоимости» словоперехода в поиске.:-) но это, вероятно, не то, что вы хотели услышать.
Ваш вопрос слишком открытый ... в чем ваша конкретная проблема?
Словарь и модель языка - это два отдельных элемента- вы не можете конвертировать одно в другое.
Словарь используется, чтобы сообщить при поиске, какие слова являются действительными и как они относятся к фонемам / фонетической транскрипции.
Модель языкаиспользуется во время распознавания высказывания с использованием вероятности униграмм, биграмм, н-грамм .. когда алгоритм поиска рассматривает переход слов.
Редактировать:
проверка:
http://www -speech.sri.com / projects / srilm / manpages / ngram-format.5.html
http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html
http://www.ling.ohio -state.edu / ~ bromberg / ngramcount / ngram2fsm.html