Скачанный Stanford POS Tagger получил разные результаты с онлайн Stanford Parser - PullRequest
0 голосов
/ 11 сентября 2018

Я загрузил самый последний Stanford POS Tagger из https://nlp.stanford.edu/software/tagger.html, а затем использовал следующий код для получения тега pos предложения:

jar = './stanford_postagger/stanford-postagger-3.9.1.jar'
model = './stanford_postagger/models/english-left3words-distsim.tagger'
pos_tagger = StanfordPOSTagger(model, jar)
text = nltk.word_tokenize('How much did the Dow rise?')
stanford_pos = pos_tagger.tag(text)

Результат для этого предложения:

[('How', 'WRB'), ('much', 'RB'), ('did', 'VBD'), ('the', 'DT'), ('Dow', ' NNP '), (' подъем ',' NN '), ('? ','. ')]

неверный вывод - интерпретировать последний глагол как существительное.

Но он-лайн анализатор на http://nlp.stanford.edu:8080/parser/index.jsp дает правильный почтовый тег:

Как / WRB много / JJ сделал / ВБД / DT доу / Н.Н. повышение / VB ? /.

Может кто-нибудь сказать мне, почему эти два дают разные результаты?

...