Я пытаюсь Sphinx распознать буквенно-цифровой ввод с помощью диалога (DialogDemo) в качестве начала. У меня есть файл .gram с:
#JSGF V1.0;
grammar dialog;
<digit> = oh |
zero |
one |
two |
three |
four |
five |
six |
seven |
eight |
nine |
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
j |
l |
m |
n |
o |
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z ;
<number> = <digit>+ [point <digit>+];
<menu_command> = digits |
[go to [the]] bank account |
weather forecast |
exit [[the] program] ;
<bank_command> = [show | check] balance |
deposit <number> |
withdraw <number> |
back ;
public <command> = <menu_command> | <bank_command>;
и файл .dict с очень ограниченным словарем:
a EY
a AH
b B IY
c S IY
d D IY
e IY
f EH F
g JH IY
h K
i AY
j JH EY
k K EY
l EH L
m EH M
o OW
p P IY
q K Y UW
r AA R
s AH S
s S
t T IY
u Y UW
v IY
w D AH B AH L Y UW
x EH K S
y W AY
z Z IY
zero Z IH R OW
one W AH N
two T UW
three TH R IY
four F AO R
five F AY V
five F AY V Z
six S IH K S
seven S EH V AH N
eight EY T
nine N AY N
Теперь это должно распознавать только эти символы, но когда я говорю заНапример, «ABC» читается как
af
keebus
Когда я говорю «1 ... 2 ... 3 ...», это читается как:
ага
аоарха
Есть ли конфликт с наличием множества коротких феномов и есть ли способ заставить его тренироваться только для этих букв / цифр в лучшемспособ