NLTK pos_tagger не распознает язык текста - PullRequest
0 голосов
/ 05 февраля 2019

Я получаю сообщение NotImplementedError от NLTK, в котором говорится, что NLTK pos_tag поддерживает только английский и русский языки, но мой корпус написан на английском языке.Кто-нибудь видел эту проблему раньше?Может ли это быть связано с кодировкой символов?

1 Ответ

0 голосов
/ 05 февраля 2019

Теперь это закрытый выпуск .Решение было реализовано в PR , где параметр 'lang' был передан в _pos_tag в pos_tag_sents в nltk/tag/__init__.py.

Попробуйте обновить nltk или просто добавьте lang параметр к предлагаемому коду.

...