Распознавание голоса с Юлием. Как сделать файл .voca? - PullRequest
0 голосов
/ 11 августа 2010

Я делаю систему распознавания голоса, и Юлиус показывает неплохие результаты в этой работе. Слова из образца .voca файла распознают отлично, но как поместить собственные слова и транскрипции в файл?

Я пробовал VoxForge (http://www.voxforge.org/) последний выпуск и ночные сборки для акустических моделей с их словарным запасом, но у меня много ошибок при запуске julius, например:

Error: voca_load_htkdict: line 19: triphone "r-d+v" not found
Error: voca_load_htkdict: line 19: triphone "d-v+aa" not found
Error: voca_load_htkdict: the line content was: 2   [AARDVARK]  aa r d v aa r k
Error: voca_load_htkdict: begin missing phones
Error: voca_load_htkdict: r-d+v
Error: voca_load_htkdict: d-v+aa
Error: voca_load_htkdict: end missing phones
Error: init_voca: error in reading /usr/src/custom/julius/quickstart/grammar/sample.dict
ERROR: failed to read dictionary "/usr/src/custom/julius/quickstart/grammar/sample.dict"
ERROR: m_fusion: some error occured in reading grammars
ERROR: Error in loading model

Кто-нибудь знает правила транскрипции слов для файлов .voca?

1 Ответ

2 голосов
/ 14 февраля 2011

причина ошибки: julius optput эти сообщения, когда ваш словарь слов содержит слова, которые не обучены в Акустической модели, потому что "voca_load_htkdict.c" пытается сопоставить трифоны в файле dict со списком трифонов в Акустической модели, поэтому, когда он не находит его, показывает эту ошибку и останавливает программу.

возможные решения ошибок: 1. включите опцию -forcedict или раскомментируйте ее файл jconf, чтобы пропустить слова ошибок в словаре и принудительно запустить. или же.. 2. сопоставьте «не найденный трифон» с наиболее близким физическим трифоном в файле hmmlist «tiedlist». например: B-EY + T V-EH + T Первый столбец - это имя triphone (генерируется из вашего словаря), а второй столбец - это имя HMM, фактически определенное в вашем AM.

но это решение может быть сделано, если «не найденных трифонов» мало, не слишком много.

  1. лучшее решение - не включать в файл dict слова, которых нет в A.M обратите внимание, что первые два решения предназначены только для тестирования julius, потому что для производственных или коммерческих проектов вы должны тренировать акустическую модель и языковую модель в одном корпусе.
...