Как вы могли заметить, я действительно новичок в питоне и обработке звука.Я (надеюсь) извлек данные FFT из волнового файла, используя python и функции logfbank и mfcc.(Кажется, что logfbank дает наиболее многообещающие данные, вывод mfcc выглядел для меня немного странно).
В моей программе я хочу изменить данные logfbank / mfcc, а затем создать из них волновые данные (и записать их).в файл).Я действительно не нашел никакой информации о процессе создания волновых данных из данных БПФ.У кого-нибудь из вас есть идеи, как это решить?Я был бы очень признателен:)
Это мой код:
from scipy.io import wavfile
import numpy as np
from python_speech_features import mfcc, logfbank
rate, signal = wavfile.read('orig.wav')
fbank = logfbank(signal, rate, nfilt=100, nfft=1400).T
mfcc = mfcc(signal, rate, numcep=13, nfilt=26, nfft=1103).T
#magic data processing of fbank or mfcc here
#creating wave data and writing it back to a .wav file here