Получение транскрипции WAV-файла для работы со Sphinx4 - PullRequest
2 голосов
/ 04 октября 2009

У меня Sphinx-4 установлено в моей системе Windows XP и настроен JSAPI. Я хотел бы переписать англоязычный WAV (или MP3) файл в текст.

Когда я запускаю демонстрацию "WavFile" - она ​​запускается успешно.

java -jar WavFile.jar

Но когда я передаю свой собственный файл WAV, как это:

java -jar WavFile.jar c:\test.wav

Я получаю:

Загрузка распознавателя как определено в 'jar: file: / C: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar! /Edu/cmu/sphinx/demo/wavfile/config.xml' ...

Расшифровка jar: file: / C: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav Результат: один два три четыре пять

Кажется, эта демонстрационная программа настроена для загрузки и запуска внутреннего wav-файла ("12345.wav") или чего-то в этом роде.

Я прочитал документы и просто не могу понять, как настроить «config.xml» или даже в каком каталоге его разместить. Я просто пытаюсь получить простое подтверждение концепции работы с использованием стандартных демонстраций ,

Итак, вопрос в том, как запустить программу Sphinx4 для расшифровки файла wav?

Спасибо.

Ответы [ 4 ]

6 голосов
/ 01 февраля 2011

Необходимо написать новое приложение (на основе Transcriber.java), которое использует словарь CMU (американский английский) вместо номеров, которые поддерживает Transcriber.jar.

Довольно странно, что Sphinx не поставляется с таким полезным образцом.

1 голос
/ 25 апреля 2014

Я знаю, что это супер старая тема, но я просто хотел отметить, что ваш пример, кажется, работает отлично. Если вы посмотрите на самый конец вашего вывода:

Расшифровка jar: file: / C: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav Результат: один два три четыре пять <========== РЕЗУЛЬТАТЫ ДЕКОДИРОВАНИЯ WAV AUDIO! </p>

1 голос
/ 25 октября 2010

Не уверен, если вам все еще нужен ответ. Но я думаю, что эта ссылка - то, что вы хотите (но работает только для цифровых данных): http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html

0 голосов
/ 04 апреля 2013

Посмотрите на упаковку карманного сфинкса. Он написан на C, скомпилирован для каждой платформы и может использоваться как командная строка или как часть приложения. Я работал с командной строкой, и она необычайно универсальна.

...