Как получить универсальную фоновую модель в sidekit для распознавания языка - PullRequest
0 голосов
/ 27 марта 2019

Я хочу получить ivectors в sidekit, поэтому у меня около 1000 аудио, сначала я получил свои mfccs с помощью:

frontend.features.mfcc(input_sig, lowfreq=100, maxfreq=8000, nlinfilt=0, nlogfilt=24, nwin=0.025, fs=16000, nceps=13, shift=0.01, get_spec=False, get_mspec=False, prefac=0.97)[source]

Итак, у меня есть 2d массив mfccs, теперь я хочу получить свой ubmи мои ivectors, но команда для получения ubm принимает сервер функций

ubm.EM_split(features_server=fs,
             feature_list=ubm_list,
             distrib_nb=1024,
             iterations=(1, 2, 2, 4, 4, 4, 4, 8, 8, 8, 8, 8, 8),
             num_thread=10,
             save_partial=False,
             ceil_cov=10,
             floor_cov=1e-2
             )

Как я могу взять свои mfccs и сделать сервер функций для получения моего ubm

Существует очень мало документации,извините, если это что-то простое, спасибо за вашу помощь

...