Kaldi - Mini librispeech - расшифровать собственный файл - PullRequest
0 голосов
/ 04 марта 2019

Я начал работать с Kaldi и сумел обучить файлы mini librispeech, что заняло довольно много времени без какого-либо графического процессора.Теперь у меня есть небольшой WAV-файл, и мне нужно выяснить, как декодировать этот файл с помощью Kaldi.Какой файл декодирования мне нужно использовать?

Было бы здорово получить любую информацию!

Cheers, Andi

1 Ответ

0 голосов
/ 14 апреля 2019

Чтобы декодировать отдельный файл, вы помещаете его имя в scp-файл decode.scp следующим образом:

decoder-test decoder-test.wav

Тогда скрипт декодирования будет выглядеть так:

online2-wav-nnet3-latgen-faster \
      --word-symbol-table=exp/tdnn/graph/words.txt --frame-subsampling-factor=3 --frames-per-chunk=51 \
      --acoustic-scale=1.0 --beam=12.0 --lattice-beam=6.0 --max-active=10000 \
      --config=exp/tdnn/conf/online.conf \
      exp/tdnn/final.mdl exp/tdnn/graph/HCLG.fst ark:decoder-test.utt2spk scp:decoder-test.scp ark:- |
    lattice-lmrescore --lm-scale=-1.0 ark:- 'fstproject --project_output=true data/lang_test_rescore/G.fst |' ark:- |
    lattice-lmrescore-const-arpa ark:- data/lang_test_rescore/G.carpa ark:- |
    lattice-align-words data/lang_test_rescore/phones/word_boundary.int exp/tdnn/final.mdl ark:- ark:- |
    lattice-to-ctm-conf --frame-shift=0.03 --acoustic-scale=0.08333 ark:- - |
    local/int2sym.pl -f 5 data/lang_test_rescore/words.txt - -

Вы можететакже попробуйте kaldi-gstreamer или py-kaldi-asr для упрощенного интерфейса для декодирования.

...