Windows распознавание речи: разница между «адаптацией акустической модели c» и «фоновой адаптацией» - PullRequest
0 голосов
/ 10 февраля 2020

. NET Framework предоставляет Windows Desktop Speech через класс SpeechRecognitionEngine. В документации по его методу UpdateRecognizerSetting перечислено несколько настроек распознавателя, включая две, относящиеся к адаптации:

  • AdaptationOn
    • "Указывает, является ли адаптация модели acousti c включена (значение = 1) или выключена (значение = 0). По умолчанию установлено значение 1 (включено). "
  • PersistedBackgroundAdaptation
    • "Указывает, включено ли фоновая адаптация (значение = 1) или ВЫКЛ (значение = 0), и сохраняет настройку в реестре. Значение по умолчанию: 1 (ВКЛ.). "
    • В документах на UpdateRecognizerSetting обратите внимание, что это единственная сохраняющаяся настройка (все остальные применяются только к экземпляру SpeechRecognitionEngine, на котором они находятся набор).
    • В этот ответ , Eri c Коричневый указывает, что PersistedBackgroundAdaptation сохраняется отдельно для каждого профиля распознавания голоса.

Учитывая эту информацию, мне интересно узнать разницу между адаптацией acousti c модели и фоновой адаптацией на . Мне не удалось найти документацию, в которой обсуждается последнее.

Мне кажется, что адаптация, которая происходит в данном экземпляре SpeechRecognitionEngine, сохраняется в текущем профиле распознавания голоса только после уничтожения SRE, если PersistedBackgroundAdaptation включено. Однако адаптация acousti c модель и фоновая адаптация звучат скорее как два отдельных механизма, а не как то, что последний просто является сохранением данных первого в экземплярах SRE.

К сожалению, я не смог выяснить, как запросить состояние адаптации, чтобы проверить это (к сожалению, на SRE нет удобного метода QueryExtentToWhichRecognizerIsAdapted). Разница в характеристиках распознавания между новым профилем и тем, который адаптирован, довольно разнообразна (по крайней мере, для моего голоса!), Что затрудняет оценку наблюдений.

...