Я пытаюсь понять, как использовать sphinx4 или pocketsphinx с английской моделью voxforge, но я не могу заставить ее работать. Я пытался читать страницы документов (например, http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html), но это мне не помогает.
Что мне нужно, так это исполняемый файл, в котором я могу указать, какую модель использовать и какой аудиофайл использовать в качестве источника, и распечатать исполняемый файл, поэтому лучше всего предположить, что говорит голос на записи.
Мне повезло с:
pocketsphinx_continuous -infile recording.wav 2> / dev / null
Но он прерывается до того, как будет полностью расшифрован аудиофайл, и модель по умолчанию имеет несколько слов, чтобы создать читаемый текст из аудио.
Я скомпилировал и протестировал демонстрации в пакете с исходным кодом sphinx4, но все примеры, похоже, содержат несколько слов и нуждаются в модели, похожей на voxforge, чтобы быть полезной для меня.
Как мне это настроить?