Как преобразовать голос в текст? - PullRequest
0 голосов
/ 13 сентября 2011

Я пытаюсь преобразовать мой wav-файл в текстовый файл, используя sphinx4.Можно ли распознать слово, которое не включено в файл грамматики?

1 Ответ

1 голос
/ 14 сентября 2011

Это распространенное заблуждение, что вы должны точно работать без какой-либо грамматики, чтобы иметь возможность эффективно распознавать речь и решать прикладные задачи.Вместо этого практично использовать какое-то решение проблемы, которое будет работать и декодировать ваши файлы.

Если вы не уверены в домене или в языке, вы всегда можете использовать очень общую языковую модель с помощью слоговграмматика для декодирования неизвестных слов.После этого часто используют веб-запросы, чтобы превратить варианты, основанные на слогах, в слова, что позволяет системе приобретать словарный запас.Это позволит вам получить хороший результат для очень общих типов речи.

Sphinx-4 поддерживает это.

...