(также спрашивается на sourceforge.net)
Я устанавливаю sphinxbase и pocketsphinx из источника (официальный cmu github, НЕ из sourceforge.net) в Ubuntu 18
(хост: Mac Pro; используется vmware fusion 11; python: 3.6)
Я копирую файл demoapp.py с официального сайта .
Исходный код работает гладко, но поддерживает только английский.
Затем, чтобы настроить его для распознавания китайского языка, я делаю некоторые изменения.
Моя языковая модель загруженаотсюда: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/zh_broadcastnews_64000_utf8.DMP/download Я преобразовал его в формат .lm.bin и .lm.
Вот моя функция init_gst () (я изменяю эту функцию только с другими функциями без изменений)
def init_gst(self):
"""Initialize the speech components"""
self.pipeline = gst.parse_launch('autoaudiosrc ! audioconvert ! audioresample '
+ '! pocketsphinx name=asr ! fakesink')
bus = self.pipeline.get_bus()
bus.add_signal_watch()
bus.connect('message::element', self.element_message)
self.pipeline.set_state(gst.State.PAUSED)
asr = self.pipeline.get_by_name('asr'); # We previously assigned pocketsphinx element a name asr
asr.set_property('lm', '/Users/cindy/Documents/pythonworkspace/sphinxenv/chinese.lm')
asr.set_property('dict', '/Users/cindy/Documents/pythonworkspace/sphinxenv/dict/chinese_dict.dict')
и вот файл chinese_dict.dict:
- ing t ing zh ib
- 後退 h ou t ui
- 左轉 zуо чж уань
- у уо чж уан
- 轉 轉 х ианг з уо чж уань
- 向右 轉 i i i y i i i i i o o u *
- 停止 тing zh ib
- 加速 j ia su
- 減速 j ian su
Графический интерфейс gstreamer успешно отображается с текстовым полем и кнопкой.
Однако, когда я нажимаю кнопку , говорю и говорю несколько китайских слов, в текстовом поле ничего не появляется.
Может быть, мой файл .lm тоже старый ? (Просто некоторые предположения, я не совсем уверен.)
Пожалуйста, помогите.
(Или, если вы можете помочь мне напечатать некоторую информацию об ошибке, я буду признателен;графический интерфейс gstreamer и терминал pycharm НИЧЕГО не показывают об ошибке.)