Не обнаруживает буквенно-цифровой ввод - CMU Sphinx Java - PullRequest
0 голосов
/ 01 октября 2019

Я пытаюсь Sphinx распознать буквенно-цифровой ввод с помощью диалога (DialogDemo) в качестве начала. У меня есть файл .gram с:

#JSGF V1.0;

grammar dialog;

<digit> = oh    |
          zero  |
          one   |
          two   |
          three |
          four  |
          five  |
          six   |
          seven |
          eight |
          nine  |
          a     |
          b     |
          c     |
          d     |
          e     |
          f     |
          g     |
          h     |
          i     |
          j     |
          k     |
          j     |
          l     |
          m     |
          n     |
          o     |
          p     |
          q     |
          r     |
          s     |
          t     |
          u     |
          v     |
          w     |
          x     |
          y     |
          z     ;

<number> = <digit>+ [point <digit>+];

<menu_command> =  digits                     |
                  [go to [the]] bank account |
                  weather forecast           |
                  exit [[the] program]       ;

<bank_command> = [show | check] balance |
                 deposit <number>       |
                 withdraw <number>      |
                 back                   ;

public <command> = <menu_command> | <bank_command>;

и файл .dict с очень ограниченным словарем:

a EY
a AH
b B IY
c S IY
d D IY
e IY
f EH F
g JH IY
h K
i AY
j JH EY
k K EY
l EH L
m EH M
o OW
p P IY
q K Y UW
r AA R
s AH S
s S
t T IY
u Y UW
v IY
w D AH B AH L Y UW
x EH K S
y W AY
z Z IY
zero Z IH R OW
one W AH N
two T UW
three TH R IY
four F AO R
five F AY V
five F AY V Z
six S IH K S
seven S EH V AH N
eight EY T
nine N AY N

Теперь это должно распознавать только эти символы, но когда я говорю заНапример, «ABC» читается как

af

keebus

Когда я говорю «1 ... 2 ... 3 ...», это читается как:

ага

аоарха

Есть ли конфликт с наличием множества коротких феномов и есть ли способ заставить его тренироваться только для этих букв / цифр в лучшемспособ

...