Я загрузил самый последний Stanford POS Tagger из https://nlp.stanford.edu/software/tagger.html, а затем использовал следующий код для получения тега pos предложения:
jar = './stanford_postagger/stanford-postagger-3.9.1.jar'
model = './stanford_postagger/models/english-left3words-distsim.tagger'
pos_tagger = StanfordPOSTagger(model, jar)
text = nltk.word_tokenize('How much did the Dow rise?')
stanford_pos = pos_tagger.tag(text)
Результат для этого предложения:
[('How', 'WRB'), ('much', 'RB'), ('did', 'VBD'), ('the', 'DT'), ('Dow', ' NNP '), (' подъем ',' NN '), ('? ','. ')]
неверный вывод - интерпретировать последний глагол как существительное.
Но он-лайн анализатор на http://nlp.stanford.edu:8080/parser/index.jsp дает правильный почтовый тег:
Как / WRB
много / JJ
сделал / ВБД
/ DT
доу / Н.Н.
повышение / VB
? /.
Может кто-нибудь сказать мне, почему эти два дают разные результаты?