Как использовать Sphinx3 в приложении - PullRequest
1 голос
/ 05 января 2012

Я какое-то время пользовался Sphinx4, что действительно соответствует моим потребностям.Я загружаю распознаватель, передаю ему аудиоданные и использую распознанную строку в своем приложении.

Сейчас я работаю над приложением C (C ++, к сожалению, не вариант), где мне нужно нечто подобное иЯ подумал, что мог бы использовать Sphinx3, который написан на C.

Проблема в том, что я действительно не знаю, как он используется внутри приложения, и нет примера "Hello World", как это предоставляет Sphinx4.

Я уже скомпилировал и установил sphinxbase и sphinx3, и теперь я могу включить заголовочные файлы sphinx в свое приложение.

Теперь к моим вопросам:

  • Существует ли "простой" и хорошо документированный пример приложения, использующего sphinx3 из среды C?
  • Как загрузитьмеханизм sphinx3 и вызвать распознаватель с моими двоичными аудиоданными?
  • ИЛИ: Нужно ли мне запускать приложение типа «sphinx3_decode» и вызывать его из моего собственного приложения?Если да, то есть ли пример приложения для этого?

Заранее спасибо!

С уважением, Роберт

Ответы [ 2 ]

4 голосов
/ 05 января 2012

Это , а не , рекомендуется использовать Sphinx3. С сайта:

Sphinx-3 - система распознавания речи большого словаря CMU. Это старый C-декодер, который мы продолжаем поддерживать. Планируется сделать устаревшим в будущем, это все еще самый точный декодер для большой словарный запас задач. Мы используем его в качестве основы для проверки Точность распознавателя. Этот декодер предназначен только для исследователей , которые хочу оценивать передовые методы в ASR, как метод поиска по дереву.

Если вам нужно использовать декодер, вы должны использовать pocketsphinx. Вы можете найти учебное пособие и документацию по API на сайте

http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx

http://cmusphinx.sourceforge.net/api/pocketsphinx/pocketsphinx_8h.html

0 голосов
/ 16 апреля 2016

Я недавно работал над проектом по пенджабскому языку.Вот некоторые шаги, которые мы использовали ...

  • Сначала мы записали аудиоданные панджаби в вакуумной комнате с частотой дискретизации 16000 Гц.
  • Затем мы взяли записанные данные и сегментировалион использовал программное обеспечение Praat в небольшие файлы формата wav и raw от 2 до 30 секунд и сохранил их в папке с именем train.
  • Затем мы взяли систему с Linux, т.е.Ubuntu и установил требуемый плагин, такой как autoconfig, automake и т. Д. И Sphinx 3 без патронов, а также 4 пакета: cmuclmtk, pocketsphinx, sphinxbase, sphinxtrain.
  • Затем, в соответствии с небольшими wav-файлами, мы создали много файлов, таких как транскрипция,dic, phone, filler, id файла, ccs и т. д.
  • Затем мы открыли терминал и набрали «sphinx_fe», чтобы проверить, работает ли сфинкс или нет.
  • Затем мы создалипапка с именем «man», а затем в терминале записывает свой путь.
  • Затем мы запускаем команду «sphinxtrain –t man setup». При выполнении этой команды в «man» будет сформирована папка с именем «etc».папка, содержащая файлы «feat_paramas» и «config».
  • В файл конфигурации были внесены изменения в соответствии с нашими данными.
  • Затем мы переместили все файлы, которые мы создали до того, т.е., dic в папке etc, которая находится в папке man.
  • Затем мы поместили скрипт 'lang1.sh' в папку etcи оставшиеся 4 скрипта в папке man.
  • Затем мы открываем путь к папке etc в терминале и запускаем команду- «lang1.sh»
  • Затем запускаем серию команд в терминале - «mfcgen2»..sh », затем« verify3.sh », затем« hmm4.sh »и, наконец,« end-test.sh », чтобы получить окончательный результат.

Отдохните, если вы работали над Sphinx 4, тогда выможет знать о файлах, которые упомянуты выше в шагах.Я надеюсь, что это поможет вам.

...