использование файла языковой модели при создании словаря - PullRequest
0 голосов
/ 20 апреля 2011

Я создал приложение для распознавания речи и текста. С этой целью я разработал словарь с помощью инструмента CMULanguage. Для создания словаря для своего проекта я добавил два файла в свою папку «Язык» в группах и файлах. Файлы имеют расширения.lm (языковая модель) и .dic.

Эти файлы предоставляются мне инструментом CMULanguage, когда я загружаю свой корпус. Я хочу знать, для чего используется этот файл .lm?знаете, пожалуйста, дайте мне знать об этой теме.

Заранее спасибо, Кристи

1 Ответ

0 голосов
/ 05 октября 2011

Словарь и языковая модель - это два отдельных элемента - вы не можете конвертировать один в другой, и вы не можете просто удалить / не предоставить один из них - необходимы оба!

словарь используется, чтобы сообщить алгоритму поиска, какие слова являются действительными и как они соотносятся с фонемами / фонетической транскрипцией.

Модель языка используется во время распознавания высказывания с использованиемграмм, би-грамм, н-грамм .. когда алгоритм поиска рассматривает переход слова.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...