Python NLTK: сообщение об ошибке Stanford NER tagger: NLTK не удалось найти файл Java - PullRequest
0 голосов
/ 18 октября 2018

Попытка заставить Stanford NER работать с Python.Следовал некоторым инструкциям в Интернете, но получил сообщение об ошибке: «NLTK не удалось найти файл Java! Используйте параметры программного обеспечения для конкретной конфигурации или установите переменную среды JAVAHOME».Что случилось?Спасибо!

from nltk.tag.stanford import StanfordNERTagger
from nltk.tokenize import word_tokenize

model = r'C:\Stanford\NER\classifiers\english.muc.7class.distsim.crf.ser.gz'
jar = r'C:\Stanford\NER\stanford-ner-3.9.1.jar'

ner_tagger = StanfordNERTagger(model, jar, encoding = 'utf-8')

text = 'While in France, Christine Lagarde discussed short-term stimulus ' \
       'efforts in a recent interview with the Wall Street Journal.'

words = word_tokenize(text)
classified_words = ner_tagger.tag(words)

1 Ответ

0 голосов
/ 18 октября 2018

Нашли решение в сети.Замените путь своим собственным.

 import os

 java_path = "C:/../../jdk1.8.0_101/bin/java.exe"   
 os.environ['JAVAHOME'] = java_path

или:

import nltk

nltk.internals.config_java('C:/../../jdk1.8.0_101/bin/java.exe')

Источник: https://tianyouhu.wordpress.com/2016/09/01/problem-of-nltk-with-stanfordtokenizer/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...