Неверный файл параметров в питоне Treetaggerwrapper - PullRequest
0 голосов
/ 04 декабря 2018

Я установил TreeTaggerwrapper для Python через PyPI.Я поместил treetaggerwrapper.py и treetaggerpoll.py в каталог Treetagger.Я также поместил файл english.par в подкаталог 'lib'.Когда я запускаю объект tagger, я получаю следующую ошибку:

tagger= treetaggerwrapper.TreeTagger(TAGLANG='en')
----> 1 tagger= treetaggerwrapper.TreeTagger(TAGLANG='en')

c:\users\kj\appdata\local\programs\python\python36\lib\site-packages\treetaggerwrapper.py in __init__(self, **kargs)
   1000         logger.debug("Using treetaggerwrapper.py from %s", osp.abspath(__file__))
   1001         self._set_language(kargs)
-> 1002         self._set_tagger(kargs)
   1003         self._set_preprocessor(kargs)
   1004         # Note: TreeTagger process is started later, when really needed.

c:\users\kj\appdata\local\programs\python\python36\lib\site-packages\treetaggerwrapper.py in _set_tagger(self, kargs)
   1087                              self.tagparfile)
   1088                 raise TreeTaggerError("TreeTagger parameter file invalid: " + \
-> 1089                                       self.tagparfile)
   1090         logger.info("tagparfile=%s", self.tagparfile)
   1091 

TreeTaggerError: TreeTagger parameter file invalid: english-utf8.par

Когда я получаю доступ к tree tagger из cmd, используя "tag-english", я получаю вывод. Может кто-то указать, что здесь не так?Я добавил директорию дерева тегов в PATH. '

1 Ответ

0 голосов
/ 06 января 2019

У меня была такая же проблема некоторое время назад.Очевидно, treetaggerwrapper ожидает, что файлы параметров будут иметь имя, например english-utf8.par.Но если вы просто извлекли файлы параметров, загруженные из TreeTagger, и не изменили их позже, вполне вероятно, что они называются примерно так: english.par.

Вы можете изменить ожидаемое имя файла в коде или изменитьимя файла параметров, соответствующего коду.(файлы параметров уже должны быть закодированы в utf8, поэтому вам не нужно менять кодировку, только имя)

...