Как получить тот же результат mf cc, что и для librosa, используя aubio? - PullRequest
0 голосов
/ 24 февраля 2020

Я пытаюсь вычислить Mf cc функцию в C ++. И я нашел Aubio (https://github.com/aubio/aubio), но я не могу дать тот же результат, что и Librosa Python (это важно). Код Librosa:

X, sample_rate = sf.read(file_name, dtype='float32')
mfccs = librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40)

Код Aubio:

#include "utils.h"
#include "parse_args.h"
#include <stdlib.h>

aubio_pvoc_t *pv;    // a phase vocoder
cvec_t *fftgrain;    // outputs a spectrum
aubio_mfcc_t * mfcc; // which the mfcc will process
fvec_t * mfcc_out;   // to get the output coefficients

uint_t n_filters = 128;
uint_t n_coefs = 40;

 void process_block (fvec_t *ibuf, fvec_t *obuf)
 {
  fvec_zeros(obuf);
  //compute mag spectrum
  aubio_pvoc_do (pv, ibuf, fftgrain);
  //compute mfccs
  aubio_mfcc_do(mfcc, fftgrain, mfcc_out);

 }

 void process_print (void)
{
  /* output times in selected format */
  print_time (blocks * hop_size);
  outmsg ("\t");
  /* output extracted mfcc */
  fvec_print (mfcc_out);
}

int main(int argc, char **argv) {
  int ret = 0;
  // change some default params
  buffer_size  = 2048;
  hop_size = 512;

  examples_common_init(argc,argv);

  verbmsg ("using source: %s at %dHz\n", source_uri, samplerate);
  verbmsg ("buffer_size: %d, ", buffer_size);
  verbmsg ("hop_size: %d\n", hop_size);

  pv = new_aubio_pvoc (buffer_size, hop_size);
  fftgrain = new_cvec (buffer_size);
  mfcc = new_aubio_mfcc(buffer_size, n_filters, n_coefs, samplerate);
  mfcc_out = new_fvec(n_coefs);
  if (pv == NULL || fftgrain == NULL || mfcc == NULL || mfcc_out == NULL) {
    ret = 1;
    goto beach;
  }
  examples_common_process(process_block, process_print);
  printf("\nlen=%u\n", mfcc_out->length);
  del_aubio_pvoc (pv);
  del_cvec (fftgrain);
  del_aubio_mfcc(mfcc);
  del_fvec(mfcc_out);

beach:
  examples_common_del();
  return ret;
}

Пожалуйста, помогите получить тот же результат Librosa или предложите любую библиотеку C ++ сделать это хорошо. Спасибо

1 Ответ

0 голосов
/ 04 марта 2020

Это может быть то, что вы ищете: C Функции речи Библиотека представляет собой полный порт python_speech_features до C и согласно документации вы должны быть возможность использовать его в проектах C ++. Результаты не будут такими же, как у Librosa, , вот почему , но вы должны иметь возможность работать с ними.

...