Различается ли величина записи PyAudio в зависимости от типа данных? - PullRequest
0 голосов
/ 03 июля 2019

Я пытаюсь записать звук с помощью PyAudio и выполнить анализ FFT на нем.

В зависимости от формата (paInt8 или paInt16) величина аудиоданных («декодированных» в приведенном ниже коде) варьируется, даже если источник звука и настройки записи одинаковы.Под величиной я подразумеваю среднюю или максимальную величину в списке значений в «декодированном».

import numpy as np
import os
import time
import pyaudio
import matplotlib.pyplot as plt
from scipy.fftpack import fft

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
RECORD_SECONDS = 10
WAVE_OUTPUT_FILENAME = "test.wav"

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=RATE,
                input=True,
                frames_per_buffer=CHUNK)

input('Press key to start recording:\n')
print('1 sec delay started') #delay so keystroke doesn't get recorded
time.sleep(1)
print("* recording")


frames = []
n = 1024
k=np.arange(n)
T = n/RATE
frq = k/T
frq = frq[range(int(n/2))] # one side frequency range
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)
    decoded = np.fromstring(data, dtype=np.int16) #grab the data in stream
    fft_decode=fft(decoded)/(len(decoded)/2) #normalized FFT
    mags=np.absolute(fft(decoded)) #
    plt.ylim(top=55000)
    plt.xlabel('Freq (Hz)')
    plt.ylabel('|Y(freq)|')
    plt.plot(frq, mags[range(int(n/2))],'b')
    plt.pause(.01)
    plt.gcf().clear()

print("* done recording")

plt.close()

Я хочу знать, что я делаю что-то не так, или это ожидалось.Моя гипотеза состоит в том, что это ожидается.И вот почему:

Микрофон выводит напряжение в зависимости от звукового давления.Напряжение микрофона усиливается, а усиленное напряжение поступает в АЦП.Усиление усилителя таково, что максимальная выходная мощность микрофона соответствует максимальному входному напряжению АЦП.АЦП преобразует входное напряжение в число, и величина этого числа может зависеть от количества бит.Допустим, максимальное входное напряжение составляет 5 В, это будет 255 для 8-битного или 65535 для 16-битного.

Когда я записываю звук с помощью PyAudio, «декодированный» состоит из чисел, которые выводит АЦП (это правда?), и это может варьироваться в зависимости от того, использовал ли я 8-битное или 16-битное кодирование.

Пожалуйста, сообщите.

...