Недавно я проделал аналогичную работу и использовал модуль audiere
import audiere
ds = audiere.open_device()
os = ds.open_array(input, fs)
os.play()
Это откроет первое доступное аудиоустройство, так как вы работаете в Windows, это, вероятно, DirectSound.input
- это просто пустой массив, fs
- частота выборки (поскольку входные данные являются необработанным массивом, вам нужно его указать).os.play()
- это неблокирующий вызов, поэтому вы можете распечатать свой текст или что-то еще, что вам нужно сделать одновременно, есть другие методы для приостановки / остановки и т. Д. Чтобы воспроизвести другие типы файлов, я просто сначала преобразовал их в wav.
Вот как я распаковал wav-файл
def wave_unpack(fname):
"""
input: wave filename as string
output: left, right, params
unpacks a wave file and return left and right channels as arrays
(in case of a mono file, left and right channels will be copies)
params returns a tuple containing:
-number of audio channels (1 for mono, 2 for stereo)
-sample width in bytes
-sampling frequency in Hz
-number of audio frames
-compression type
-compression name
"""
import sndhdr, os, wave, struct
from scipy import array
assert os.path.isfile(fname), "file location must be valid"
assert sndhdr.what(fname)[0] == 'wav', "file must have valid header"
try:
wav = wave.open(fname)
params = (nchannels,sampwidth,rate,nframes,comp,compname) = wav.getparams()
frames = wav.readframes(nframes*nchannels)
finally:
wav.close()
out = struct.unpack_from ("%dh" % nframes*nchannels, frames)
if nchannels == 2:
left = array(out[0::2])
right = array(out[1::2])
elif nchannels == 1:
right = left = array(out)
else:
assert 0, "number of channels must be 1 or 2"
return left, right, params
Так, например, чтобы сделать input
и fs
, вы можете пойти:
from scipy import c_
left, right, params = wave_unpack(fn)
fs = params[2]
left_float = left.astype('f')/2**15
right_float = right.astype('f')/2**15
stereo = c_[left_float, right_float]
input = mono = stereo.mean(1)
Это подходит мнено мои требования были для FFT-ввода, а не для караоке :)
Я уверен, что audiere
имеет стереофоническое воспроизведение, просто давая массив 2-dim.