Librosa генерирует массив массивов тяжелых MFCC - PullRequest
0 голосов
/ 03 ноября 2018

У меня есть аудиофайл размером 1.25 ГБ .acc.

Моя проблема, когда я пытаюсь получить функции, используя librosa.feature.mfcc

Конфигурация

SampleRate = 22050
Hop = 512
n_mfcc features = 40 
  1. это занимает несколько часов подряд

  2. использует много памяти

Я хотел бы знать, есть ли лучший более быстрый / легкий способ извлечь функции mfcc

С уважением

1 Ответ

0 голосов
/ 02 декабря 2018

Функции MFCC вычисляются для каждого кадра. Если у вас есть размер скачка 512, размер кадра составляет только 1024 или 2048 значений. Поэтому, если вы выполняете потоковую передачу файла AAC и загружаете небольшие фрагменты с размером кадра M *, вам не нужно загружать все это в память.

Это можно сделать с помощью обработки блока Pysoundfile: https://pysoundfile.readthedocs.io/en/0.9.0/#block-processing

Альтернативой является нарезка вашего файла на NN секундных файлов, индивидуальная обработка и последующее объединение результатов.

...