Есть ли CMU Sphinx local lmtool для Java? - PullRequest
0 голосов
/ 26 декабря 2011

Я хочу преобразовать слова в перевод Arpabet.

Что-то вроде:

HELLO   HH AH L OW

Но я хочу сделать это программно в Java, sphinx предлагает веб-инструмент здесь http://www.speech.cs.cmu.edu/tools/lmtool.html. Я знаю, что могу запросить этот инструмент в Java, используя сокеты и выискивая возвращенный файл .dic, но я не могу использовать это, потому что не у всех пользователей моего приложения есть подключение к Интернету.

Я также выписалсяпакет логос Sphinx, но он написан на Perl и пакетных файлах.Я могу использовать его, но я хочу сделать свое приложение независимым от платформы, и я думаю, что это будет немного непозволительно, если я включу perl shell в свой проект.

Если есть какая-либо библиотека Java или алгоритм, который я могу использовать повторно, так что ямогу просто сделать что-то вроде ConvertToSphinxArpabet("HELLO"), и я получаю строку "HH AH L OW".

1 Ответ

1 голос
/ 28 декабря 2011

Пожалуйста, проверьте учебник:

http://cmusphinx.sourceforge.net/wiki/tutorialdict

Например, вы можете использовать g2p-код из FreeTTS, написанный на Java:

http://cmusphinx.sourceforge.net/projects/freetts

OpenMary Java TTS:

http://mary.dfki.de/

Пример FreeTTS приведен в нашем коде в длинной ветке выравнивателя звука:

http://cmusphinx.svn.sourceforge.net/viewvc/cmusphinx/branches/long-audio-aligner/Aligner/src/edu/cmu/sphinx/linguist/dictionary/AllWordDictionary.java?revision=11092&view=markup

...