Как обнаружить речевой компонент из аудио в Android? - PullRequest
0 голосов
/ 19 декабря 2011

Какой простой способ обнаружить речевые части аудиопотока в реальном времени? Я уже об использовании MFCC, FFT и так далее. Но я не смог найти четкого объяснения того, как это сделать.

Кроме того, существует ли какая-либо компьютерная программа, которая может анализировать файлы wav и обнаруживать присутствие человеческой речи в ней?

1 Ответ

2 голосов
/ 19 декабря 2011

Эта тема настолько сложна ...;нет простых решений или четких объяснений;Есть много существующих методов и алгоритмов.Современные методы включают в себя алгоритмы искусственного интеллекта и машинного обучения, а не только тривиальные алгоритмы DSP, такие как БПФ или кепстральный анализ.Тем не менее, вы можете попробовать Sphinx-4, который написан на Java, так что он естественно кроссплатформенный.

http://cmusphinx.sourceforge.net/sphinx4/

Я не пробовал этого, поэтому не могу ничего сказать о его удобстве, но будьте уверены, что лучшие алгоритмы запатентованы и действительно очень дороги ...

...