Сравнение двух звуков речи - PullRequest
4 голосов
/ 29 мая 2010

Мне нужно определить, похожи ли два звука. Цель состоит в том, чтобы иметь очень ограниченный словарный запас (10 или 15) коротких одного или двух слоговых слов, а затем сравнить захваченный звук, чтобы определить, является ли он одним из тех элементов со всей обычной изменчивостью условий окружающей среды и условий захвата. Идея состоит в том, что пользователь может вводить несколько простых команд голосом вместо клавиатуры или мыши.

Кто-нибудь знает лучший подход к этому? Я не хочу делать полноценное распознавание речи, просто что-то гораздо более ограниченное.

1 Ответ

3 голосов
/ 29 мая 2010

Я бы пересмотрел использование библиотеки распознавания речи ... как программное обеспечение CMU Sphinx или распознаватель речи Microsoft . К сожалению, это не простая задача сделать это самостоятельно. Один из подходов, который несколько типичен для выполнения того, что вы пытаетесь сделать, заключается в следующем:

1) Нарезать образец на маленькие сегменты (несколько миллисекунд)

2) Преобразование Фурье на каждом сегменте, собрать главные коэффициенты

3) использовать скрытую марковскую модель, чтобы выяснить вероятный переход фонем с учетом вашей последовательности коэффициентов

4) сопоставление со словарем, отображающим фонемы для слов (вы можете посмотреть в качестве справочника по словарю Сфинкса) ... небольшой набор, подобный вашему, должен дать отличные результаты.


Если вы хотите несколько упростить это, вы можете попытаться взять коэффициенты на определенных временных шагах и передать их в SVM или нейронную сеть ... Я еще не пробовал, но держу пари, что вы можете получить разумные результаты с некоторой настройкой.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...