Обратите внимание, что я сам не работал со звуком G.711 PCM, но я предполагаю, что вы выполняете правильное преобразование из закодированной амплитуды в фактическую амплитуду перед обработкой значений.
Можно ожидать, что среднее значение большинства сэмплов будет приблизительно равно нулю, поскольку звуковые колебания колеблются по обе стороны от нуля.
Расчет объема сырой нефти будет представлять собой среднеквадратичное значение (среднеквадратичное значение), т.е. берется скользящее среднее квадрата выборок и берется квадратный корень из этого среднего. Это даст вам положительное количество, когда есть какой-то звук; величина связана с мощностью, представленной в форме волны.
Что-то лучше, связанное с человеческим восприятием объема, вы можете изучить методы, используемые в Replay Gain .