Я экспериментирую с библиотекой python NLTK для обработки естественного языка.
Моя проблема: Я пытаюсь выполнить stemming;приведите слова к их нормированной форме.Но это не производит правильные слова.Правильно ли я использую класс stemming?И как я могу получить результаты, которые я пытаюсь получить?
Я хочу нормализовать следующие слова:
words = ["forgot","forgotten","there's","myself","remuneration"]
... в это:
words = ["forgot","forgot","there","myself","remunerate"]
Мой код:
from nltk import stem
words = ["forgot","forgotten","there's","myself","remuneration"]
for word in words:
print stemmer.stem(word)
#output is:
#forgot forgotten there' myself remuner