Влияет ли изменение параметра MCI_RECORD на речевое расположение SAPI? - PullRequest
1 голос
/ 20 января 2010
Intially I have specified MCI_WAVE_SET_PARMS at the time of recording as follows:

MCI_WAVE_SET_PARMS mciSetParms;
mciSetParms.wFormatTag = WAVE_FORMAT_PCM;
mciSetParms.wBitsPerSample = 16;
mciSetParms.nChannels = 2;
mciSetParms.nSamplesPerSec = 11050;

Now if I change it to 

MCI_WAVE_SET_PARMS mciSetParms;
mciSetParms.wFormatTag = WAVE_FORMAT_PCM;
mciSetParms.wBitsPerSample = 8;
mciSetParms.nChannels = 1;
mciSetParms.nSamplesPerSec = 8000;

Повлияет ли это на распознавание речи, выполняемое SAPI?

Ответы [ 2 ]

1 голос
/ 03 февраля 2010

Да, будет. Для распознавания SAPI действительно требуется 16-битный звук не менее 11 кГц. Предоставление ему 8 кГц и 8-битного звука существенно ухудшит скорость распознавания (если вы вообще узнаете).

Примечание. Снижение каналов со 2 до 1 вообще не повлияет на SAPI.

0 голосов
/ 22 января 2010

Я думаю, что это должно повлиять.

См. Следующую ссылку:

http://en.wikipedia.org/wiki/Acoustic_Model

...