Как обнаружить голос из аудиопотока - PullRequest
2 голосов
/ 03 декабря 2011

Мне нужно определить, когда кто-то говорит в аудиопотоке. Я применил окно Хэмминга и рассчитал БПФ. Как я могу обнаружить человеческий голос отсюда?

Ответы [ 2 ]

2 голосов
/ 04 декабря 2011

Если вы хотите поэкспериментировать с собственными алгоритмами обнаружения голосовой активности, в качестве начальной стадии можно использовать БПФ.Затем вы можете попытаться вычесть любой характерный фон спектрального шума.Затем вы можете попробовать использовать модифицированные результаты БПФ для расчета кепстра (или некоторых взвешенных кепстральных коэффициентов) для извлечения признаков.Затем можно выполнить статистическое сопоставление с образцами для любых векторов признаков, которые вы решили извлечь, и передать результаты в алгоритм принятия решений.

Каждый из вышеперечисленных шагов, вероятно, был темой исследования, и хорошая реализация может включатьизучая десятки опубликованных научных работ, которые, возможно, можно найти в вашей университетской библиотеке.

1 голос
/ 03 декабря 2011

Для этого вам не нужно делать БПФ, вам нужно реализовать алгоритм Обнаружение голосовой активности .

...