Я использую функцию Kaldi для ASR от python.
Я использовал функцию fbank от compute_fbank.sh
затем я нормализовал его командой compute-cmvm-stats.
это работает хорошо, но теперь мне нужно сделать некоторые изменения:
Я вычислил нормализованную функцию с помощью python вместо использования compute-cmvn-stats (мне нужно вычислить ее с помощью python):
Сначала я использовал compute_fbank.sh
затем после получения функции fbank, x, я нормализовал ее следующим образом:
# x.shape is (batch, frames, fbank_feat)
mean = np.mean(x, axis=1)
x = x - mean
но последняя функция не равна функции cmvn, с помощью compute-cmvm-stats я не нормализую функцию по отклонениям, поэтому я не знаю, почему они отличаются!
и когда я тренирую ASR этим, он не тренируется! конечный результат ужасен!
Может кто-нибудь сказать мне, почему мой вычисляемый cmvn не равен командой compute-cmvm-stats ?!
Я знаю по compute-cmvm-stats, что могу «нормализовать функцию по дисперсии», а также нормализовать по каждому динамику вместо каждого высказывания, но я не использовал параметр дисперсии и параметр динамика.