Если вы хотите пиковые данные с разрешением 1/20 секунды, используйте это как отправную точку.
ffmpeg -i audio.wav -af "aresample=60000,asetnsamples=3000,astats=reset=1:metadata=1,ametadata=print:key='lavfi.astats.Overall.Peak_level':file=stats.log" -f null -
Идея состоит в том, чтобы использовать достаточно высокую частоту дискретизации, используя aresample, а затем разделить аудио на равные куски, каждый равный 1/20 секунды, используя asetnsamples. Затем astats будет измерять журнал данных по кадрам (сброс = 1). Затем ametadata запишет значение для пикового уровня (в дБ) в текстовый файл.