Невозможно открыть аудиофайл на Heroku с помощью Librosa - PullRequest
0 голосов
/ 15 марта 2020

У меня есть API REST для извлечения функций, написанный на Python с использованием библиотеки Librosa (Извлечение функций звука), он получает аудиофайл через HTTP POST и отвечает списком функций (например, MF CC). , et c) .

Поскольку librosa зависит от SoundFile (libsndfile1 / libsndfile-dev), она не поддерживает все форматы, я конвертирую аудиофайл с помощью ffmpeg - python обертка (https://kkroening.github.io/ffmpeg-python/).

Она прекрасно работает на моей машине Windows 10 с Conda , но при развертывании в Heroku функции librosa.load () возвращают неизвестную ошибку формата, независимо от того, в какой формат я ее конвертирую. Я пробовал FLA C, AIFF и WAV .

Мое первое предположение состоит в том, что преобразованный формат не поддерживается libsndfile1, но он работает на моем локальном сервере (плюс их документация гласит, что AIFF и WAV поддерживаются), поэтому я немного растерялся.

Я приложил все соответствующие фрагменты кода ниже, я могу предоставить что-нибудь дополнительное, если это необходимо. Любая помощь высоко ценится. Спасибо.

ОБНОВЛЕНИЕ1:

Я использую каналы вместо записи и чтения с диска, стоит упомянуть, поскольку в противном случае вопрос может вводить в заблуждение.

Журнал:

File "/app/app.py", line 31, in upload
x , sr = librosa.load(audioFile,mono=True,duration=5)
File "/app/.heroku/python/lib/python3.6/site-packages/librosa/core/audio.py", line 164, in load
six.reraise(*sys.exc_info())
File "/app/.heroku/python/lib/python3.6/site-packages/six.py", line 703, in reraise
raise value
File "/app/.heroku/python/lib/python3.6/site-packages/librosa/core/audio.py", line 129, in load
with sf.SoundFile(path) as sf_desc:
File "/app/.heroku/python/lib/python3.6/site-packages/soundfile.py", line 629, in __init__
self._file = self._open(file, mode_int, closefd)
File "/app/.heroku/python/lib/python3.6/site-packages/soundfile.py", line 1184, in _open
"Error opening {0!r}: ".format(self.name))
File "/app/.heroku/python/lib/python3.6/site-packages/soundfile.py", line 1357, in _error_check
raise RuntimeError(prefix + _ffi.string(err_str).decode('utf-8', 'replace'))
RuntimeError: Error opening <_io.BytesIO object at 0x7f46ad28beb8>: File contains data in an unknown format.
10.69.244.94 - - [15/Mar/2020:12:37:28 +0000] "POST /receiveWav HTTP/1.1" 500 290 "-" "curl/7.55.1"

Код Flask / Librosa, развернутый в Heroku (app.py):

from flask import Flask, jsonify, request
import scipy.optimize
import os,pickle
import numpy as np
from sklearn.preprocessing import StandardScaler
import librosa
import logging
import soundfile as sf
from pydub import AudioSegment
import subprocess as sp
import ffmpeg
from io import BytesIO

logging.basicConfig(level=logging.DEBUG)

app = Flask(__name__) 

@app.route('/receiveWav',methods = ['POST'])
def upload():
    if(request.method == 'POST'):
        f = request.files['file']
        app.logger.info(f'AUDIO FORMAT\n\n\n\n\n\n\n\n\n\n: {f}')
        proc = (
            ffmpeg.input('pipe:')
            .output('pipe:', format='aiff')
            .run_async(pipe_stdin=True,pipe_stdout=True, pipe_stderr=True)
        )
        audioFile,err = proc.communicate(input=f.read())
        audioFile =  BytesIO(audioFile)
        scaler = pickle.load(open("scaler.ok","rb"))
        x , sr = librosa.load(audioFile,mono=True,duration=5)
        y=x
        #Extract the features
        chroma_stft = librosa.feature.chroma_stft(y=y, sr=sr)
        spec_cent = librosa.feature.spectral_centroid(y=y, sr=sr)
        spec_bw = librosa.feature.spectral_bandwidth(y=y, sr=sr)
        rolloff = librosa.feature.spectral_rolloff(y=y, sr=sr)
        zcr = librosa.feature.zero_crossing_rate(y)
        rmse = librosa.feature.rms(y=y)
        mfcc = librosa.feature.mfcc(y=y, sr=sr)
        features = f'{np.mean(chroma_stft)} {np.mean(rmse)} {np.mean(spec_cent)} {np.mean(spec_bw)} {np.mean(rolloff)} {np.mean(zcr)}'    
        for e in mfcc:
            features += f' {np.mean(e)}'
        input_data2 = np.array([float(i) for i in features.split(" ")]).reshape(1,-1)
        input_data2 = scaler.transform(input_data2)
        return jsonify(input_data2.tolist())

# driver function 
if __name__ == '__main__':   
    app.run(debug = True) 

Aptfile:

libsndfile1
libsndfile-dev
libav-tools
libavcodec-extra-53 
libavcodec-extra-53
ffmpeg 

needs.txt:

aniso8601==8.0.0
audioread==2.1.8
certifi==2019.11.28
cffi==1.14.0
Click==7.0
decorator==4.4.2
ffmpeg-python==0.2.0
Flask==1.1.1
Flask-RESTful==0.3.8
future==0.18.2
gunicorn==20.0.4
itsdangerous==1.1.0
Jinja2==2.11.1
joblib==0.14.1
librosa==0.7.2
llvmlite==0.31.0
MarkupSafe==1.1.1
marshmallow==3.2.2
numba==0.48.0
numpy==1.18.1
pycparser==2.20
pydub==0.23.1
pytz==2019.3
resampy==0.2.2
scikit-learn==0.22.2.post1
scipy==1.4.1
six==1.14.0
SoundFile==0.10.3.post1
Werkzeug==1.0.0
wincertstore==0.2
...