Ну, wav - это просто данные PCM.Я бы начал с прочтения: http://en.wikipedia.org/wiki/Pulse-code_modulation
Я делал это раньше ... Вы начинаете извлекать сэмплы из данных PCM.Затем вы проверяете каждый из них, чтобы увидеть, превышает ли он пороговые значения, которые вы установили.Например, предполагая 16-битные выборки ... Например, любое значение от нуля до 15000 - тишина, все, что больше 15001 - звук.Только не забудьте иметь дело с неподписанными целочисленными значениями, иначе у вас будет отрицательный результат в PCM.Кроме того, помните лог против линейного, когда вы играете с порогом.