Я использовал этот код:
# Step 1 : TOKENIZE
from nltk.tokenize import *
words = word_tokenize(text)
# Step 2 : POS DISAMBIG
from nltk.tag import *
tags = pos_tag(words)
, чтобы отметить два предложения: Джон очень милый.Джон очень хорош?
Джон в первом предложении был NN, а во втором - VB!Итак, как мы можем исправить функцию pos_tag, не тренируя отступные тегеры?
Измененный вопрос:
Я видел демонстрацию тегеров NLTK здесь http://text -processing.com /демо / теги / .Когда я попробовал опцию «Английские Tagger & Chunckers: Treebank» или «Brown Tagger», я получил правильные теги.Так как же использовать Brown Tagger, например, не тренируя его?