Я пытаюсь записать звук с помощью PyAudio и выполнить анализ FFT на нем.
В зависимости от формата (paInt8 или paInt16) величина аудиоданных («декодированных» в приведенном ниже коде) варьируется, даже если источник звука и настройки записи одинаковы.Под величиной я подразумеваю среднюю или максимальную величину в списке значений в «декодированном».
import numpy as np
import os
import time
import pyaudio
import matplotlib.pyplot as plt
from scipy.fftpack import fft
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
RECORD_SECONDS = 10
WAVE_OUTPUT_FILENAME = "test.wav"
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
input('Press key to start recording:\n')
print('1 sec delay started') #delay so keystroke doesn't get recorded
time.sleep(1)
print("* recording")
frames = []
n = 1024
k=np.arange(n)
T = n/RATE
frq = k/T
frq = frq[range(int(n/2))] # one side frequency range
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
decoded = np.fromstring(data, dtype=np.int16) #grab the data in stream
fft_decode=fft(decoded)/(len(decoded)/2) #normalized FFT
mags=np.absolute(fft(decoded)) #
plt.ylim(top=55000)
plt.xlabel('Freq (Hz)')
plt.ylabel('|Y(freq)|')
plt.plot(frq, mags[range(int(n/2))],'b')
plt.pause(.01)
plt.gcf().clear()
print("* done recording")
plt.close()
Я хочу знать, что я делаю что-то не так, или это ожидалось.Моя гипотеза состоит в том, что это ожидается.И вот почему:
Микрофон выводит напряжение в зависимости от звукового давления.Напряжение микрофона усиливается, а усиленное напряжение поступает в АЦП.Усиление усилителя таково, что максимальная выходная мощность микрофона соответствует максимальному входному напряжению АЦП.АЦП преобразует входное напряжение в число, и величина этого числа может зависеть от количества бит.Допустим, максимальное входное напряжение составляет 5 В, это будет 255 для 8-битного или 65535 для 16-битного.
Когда я записываю звук с помощью PyAudio, «декодированный» состоит из чисел, которые выводит АЦП (это правда?), и это может варьироваться в зависимости от того, использовал ли я 8-битное или 16-битное кодирование.
Пожалуйста, сообщите.