Я пытаюсь скопировать http://kaldi -asr.org / doc / kaldi_for_dummies.html , чтобы начать работу над решением для автоматического распознавания речи, которое я пытаюсь разработать. Я следовал всем инструкциям в этом уроке и наконец запустил скрипт run.sh . Однако я получил следующие ошибки в терминале.
===== PREPARING ACOUSTIC DATA =====
./run.sh: line 22: data/train/spk2utt: No such file or directory
./run.sh: line 23: data/test/spk2utt: No such file or directory
===== FEATURES EXTRACTION =====
steps/make_mfcc.sh --nj 1 --cmd run.pl data/train exp/make_mfcc/train mfcc
make_mfcc.sh: no such file data/train/wav.scp
steps/make_mfcc.sh --nj 1 --cmd run.pl data/test exp/make_mfcc/test mfcc
make_mfcc.sh: no such file data/test/wav.scp
steps/compute_cmvn_stats.sh data/train exp/make_mfcc/train mfcc
make_cmvn.sh: no such file data/train/feats.scp
steps/compute_cmvn_stats.sh data/test exp/make_mfcc/test mfcc
make_cmvn.sh: no such file data/test/feats.scp
===== PREPARING LANGUAGE DATA =====
utils/prepare_lang.sh data/local/dict <UNK> data/local/lang data/lang
Checking data/local/dict/silence_phones.txt ...
--> reading data/local/dict/silence_phones.txt
--> text seems to be UTF-8 or ASCII, checking whitespaces
--> text contains only allowed whitespaces
--> data/local/dict/silence_phones.txt is OK
Checking data/local/dict/optional_silence.txt ...
--> reading data/local/dict/optional_silence.txt
--> text seems to be UTF-8 or ASCII, checking whitespaces
--> text contains only allowed whitespaces
--> data/local/dict/optional_silence.txt is OK
Checking data/local/dict/nonsilence_phones.txt ...
--> reading data/local/dict/nonsilence_phones.txt
--> text seems to be UTF-8 or ASCII, checking whitespaces
--> text contains only allowed whitespaces
--> data/local/dict/nonsilence_phones.txt is OK
Checking disjoint: silence_phones.txt, nonsilence_phones.txt
--> disjoint property is OK.
Checking data/local/dict/lexicon.txt
--> reading data/local/dict/lexicon.txt
--> text seems to be UTF-8 or ASCII, checking whitespaces
--> text contains only allowed whitespaces
--> data/local/dict/lexicon.txt is OK
Checking data/local/dict/extra_questions.txt ...
--> data/local/dict/extra_questions.txt is empty (this is OK)
--> SUCCESS [validating dictionary directory data/local/dict]
**Creating data/local/dict/lexiconp.txt from data/local/dict/lexicon.txt
utils/prepare_lang.sh: line 468: fstarcsort: command not found
utils/prepare_lang.sh: line 466: fstcompile: command not found
Exception ignored in: <_io.TextIOWrapper name=1 mode='w' encoding='latin-1'>
BrokenPipeError: [Errno 32] Broken pipe
===== LANGUAGE MODEL CREATION =====
===== MAKING lm.arpa =====
data/local/corpus.txt: No such file or directory
===== MAKING G.fst =====
./run.sh: line 75: arpa2fst: command not found
===== MONO TRAINING =====
steps/train_mono.sh --nj 1 --cmd run.pl data/train data/lang exp/mono
cat: data/lang/oov.int: No such file or directory
Здесь я пытаюсь понять ошибку, выданную в первом разделе «Подготовка акустических данных»
===== PREPARING ACOUSTIC DATA =====
./run.sh: line 22: data/train/spk2utt: No such file or directory
./run.sh: line 23: data/test/spk2utt: No such file or directory
Я сделал файл utt2spk в папках данных train и test, но я не могу понять, почему эта ошибка появляется? Я отладил скрипт run.sh и нашел эту строку, где у меня может быть проблема.
# Making spk2utt files
utils/utt2spk_to_spk2utt.pl data/train/utt2spk > data/train/spk2utt
utils/utt2spk_to_spk2utt.pl data/test/utt2spk > data/test/spk2utt
Может кто-нибудь помочь мне решить эту проблему? Я использую Linux Ubuntu XFCE. У меня установлены g ++, gcc и все зависимые пакеты (не ATLAS).