Различные уровни в программном обеспечении распознавания речи - PullRequest
2 голосов
/ 01 августа 2009

Есть фонетический уровень, синтаксический уровень, семантический уровень, фонологический уровень, акустический уровень, языковой уровень, языковой уровень.

Есть ли другие уровни?

Какой порядок снизу вверх?

А о чем они на самом деле?

1 Ответ

1 голос
/ 02 августа 2009

Язык допускает большое разнообразие, но он также подчиняется многим правилам (хотя часто и свободным, с множеством исключений). Таким образом, на определенном языке определенные звуки с большей вероятностью будут следовать за другими звуками, определенные слова с большей вероятностью будут следовать за другими, и так далее. Уровни в основном уровень моделирования.

Акустический уровень пытается определить, какие акустические сигналы полезны для распознавания человеческой речи. Он пытается ответить на такие вопросы, как «Это фоновый шум или звук речи?»

Фонологический уровень основан на том, какие звуки наиболее вероятно объединяются, когда он пытается преобразовать акустический сигнал в последовательность фонем. Я думаю, что это по сути то же самое, что и фонетический уровень.

Уровень языка определяет, какой акцент у пользователя, диалект и т. Д.

На синтаксическом уровне вы смотрите, какие слова могут появляться вместе, основываясь на синтаксисе предложения. Это избавляет от слов, которые он бы догадался на основе фонологического уровня, но построил бы неграмотные предложения.

Лингвистический уровень, насколько я понимаю, это больше вопрос выбора правильного слова (например, какой омоним наш против час ) на основе контекста.

На семантическом уровне он пытается смоделировать значение предложения и избавиться от вещей, которые не соответствуют грамматическим отношениям глаголов и предлогов. Например, глагол исчезать не требует прямого объекта, поэтому, если в этом семантическом слоте есть что-то, вероятно, есть ошибка.

Порядок будет зависеть от приложения на самом деле, некоторые из них могут быть свернуты друг в друга, некоторые могут вообще не использоваться. Концептуальная иерархия, которая имеет смысл для меня, является акустической <фонологическая = фонетическая <язык <синтаксическая <лингвистическая <семантическая. </p>

...