Я хотел бы извлечь одномерный вектор из саундтрека, просто представляя его «громкость» или «интенсивность» (я не уверен насчет этой терминологии) в данный момент времени.
Например,доступный образец:
wget https://freewavesamples.com/files/Ensoniq-ESQ-1-Sympy-C4.wav
И преобразование его в mono
:
ffmpeg -i Ensoniq-ESQ-1-Sympy-C4.wav -acodec pcm_s16le -ac 1 -ar 44100 audio_test.wav
Я собрал из связанныхТема вопросов и ответов для визуализации звуковой волны:
from scipy.io.wavfile import read
import matplotlib.pyplot as plt
input_data = read("audio_test.wav")
audio = input_data[1]
plt.plot(audio)
plt.ylabel("Amplitude")
plt.xlabel("Time")
plt.title("Sample Wav")
plt.show()
Положительные и отрицательные стороны довольно симметричны, ноне полностью. Есть ли способ объединить их в одну «позитивную» линию? Если да, как я могу извлечь такие точки данных из переменной audio
?
Большое спасибо за вашу помощь!