Что означает скобка с результатом cmusphinx? - PullRequest
1 голос
/ 17 октября 2019

Мой вывод:

['<s>', 'does', 'any', '<sil>', 'unable', 'to(3)', 'bear', 'the', 'senate', 'is', 'touching', 'emotion', 'turned', 'away', '<sil>', 'and(2)', 'ill', 'afford', '<sil>', 'without', 'seeking', 'any', 'further', 'explanation', '<sil>', 'and(2)', 'attracted', 'towards(2)', 'him', 'and', 'irresistible', 'magnetism', 'which', 'draws', 'us', 'towards(2)', 'those', 'who', 'have', 'loved', 'to(3)', 'people', 'for(2)', 'whom', 'we', 'mourn', '<sil>', 'extended', 'his', 'hand', 'towards(2)', 'the(2)', 'young', 'man', '</s>']

Я получаю то, что <s> и <sil> делают. Но как насчет to(3)?

1 Ответ

2 голосов
/ 17 октября 2019

Трудно сказать с абсолютной уверенностью без проверки файла словаря (обычно это файл с расширением .dict), который связывает каждое слово с его произношением. Затем вы можете проверить, насколько он отличается (предположительно) to(2) или to. (Или даже если эти вариации вообще существуют.)

Однако, поскольку многие слова с одинаковым написанием имеют разное произношение, соглашение состоит в том, чтобы учитывать слова с разными символами в словаре, как указано в * 1007. * официальный учебник .

Словарь может также содержать альтернативные произношения. В этом случае вы можете обозначить их числом в скобках:

TH IH

(2) TH AH

InВ приведенном выше примере программное обеспечение будет распознаваться по-разному в зависимости от того, как говорящий сказал это по-разному.

Если вы используете готовую официальную модель, то это так. Предполагая, что вас не так сильно волнует как произносится и больше о как произносится, вы можете игнорировать скобки.

...