Python NLTK с использованием локальных данных nltk_data - PullRequest
0 голосов
/ 25 октября 2018

Я недавно работал с библиотекой NLTK для языковой обработки.Обычно я могу устанавливать пакеты, используя nltk.download («пакет»), если у меня есть доступ к Интернету и т. Д.

Проблема возникает, если я пытаюсь запустить свой код в автономном режиме в кластере.Здесь

from nltk.tag import PerceptronTagger
ImportError: cannot import name 'PerceptronTagger'

и подобные ошибки появляются, поскольку nltk не может найти папку nltk_data.Я попытался:

  1. nltk.data.path.append ("./ nltk_data"), куда я скопировал nltk_data вместе с кодом.

  2. nltk.download ('punct') #, download_dir = "./ nltk_data"), но это не работает, так как нет доступа в Интернет.

Вопрос в том, какя могу использовать nltk_data локально?

Спасибо.

1 Ответ

0 голосов
/ 26 октября 2018

Похоже, что на машине, на которой я работал, был NLTK 3.0.2, поэтому обновление NLTK решило проблему все вместе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...