Легко написать файл грамматики для распознавания речи всего из 50 слов, потому что вы можете просто сделать это вручную. Какой самый простой и эффективный способ сделать это, если у вас есть 10000 или 100000 слов?
Пример:
Скажем, у нас есть "RC Cola" и "Pepsi Cola" У нас будет файл грамматики, состоящий из 2 правил:
НАПИТОК: (КОЛАНАЯ? [Содовая кола))
КОЛАНАЙМ: [rc pepsi]
Он будет признавать "RC", "RC Coke", "RC Cola", "RC Soda", "Pepsi", "Pepsi Coke", "Pepsi Cola" и "Pepsi Soda".
Edit:
Я говорю о грамматике для распознавания речи. Системы распознавания речи нуждаются в сопровождающем файле грамматики, чтобы они знали, что распознавать (gsl, grxml). И на самом деле я думал не о каких-либо словах, а о чем-то вроде имен, которые нельзя классифицировать по категориям.