Я только начал экспериментировать с обработкой естественного языка.Мои первые несколько строк кода с NLTK дали непонятные результаты.
import nltk
exampleArray = ['The book is hers',
'The book is his']
for item in exampleArray:
tokenized = nltk.word_tokenize(item)
tagged = nltk.pos_tag(tokenized)
print(tagged)
Вывод:
[('The', 'DT'), ('book', 'NN'), ('is', 'VBZ'), ('hers', 'NNS')]
[('The', 'DT'), ('book', 'NN'), ('is', 'VBZ'), ('his', 'PRP$')]
Почему «его» и «ее» помечены так по-разному?