Как обнаружить присутствие слова / аудио тишины в файле WAV с помощью Java? - PullRequest
4 голосов
/ 29 августа 2010

Я работаю над проектом по распознаванию речи, так как хочу получить из wav-файла информацию о присутствии тишины или о наличии слова. И если слово найдено, скопируйте его из начала в конец новый WAV-файл, так что в исходном WAV-файле содержится 10 слов, а затем выводится 10 файл .. Проблема заключается в обнаружении молчания или слова хочу предложение о том, как реализовать это в Java .. пожалуйста, предложите ..

1 Ответ

6 голосов
/ 30 августа 2010

Ну, wav - это просто данные PCM.Я бы начал с прочтения: http://en.wikipedia.org/wiki/Pulse-code_modulation

Я делал это раньше ... Вы начинаете извлекать сэмплы из данных PCM.Затем вы проверяете каждый из них, чтобы увидеть, превышает ли он пороговые значения, которые вы установили.Например, предполагая 16-битные выборки ... Например, любое значение от нуля до 15000 - тишина, все, что больше 15001 - звук.Только не забудьте иметь дело с неподписанными целочисленными значениями, иначе у вас будет отрицательный результат в PCM.Кроме того, помните лог против линейного, когда вы играете с порогом.

...