Может ли WordNetLemmatizer в Nltk основываться на словах? - PullRequest
4 голосов
/ 12 июля 2011

Я хочу найти слова, связанные с Wordnet. Есть ли у wordnet функция стемминга? Я использую этот импорт в качестве основы, но он не работает должным образом.

from nltk.stem.wordnet import WordNetLemmatizer
WordNetLemmatizer().lemmatize('Having','v')

Ответы [ 3 ]

10 голосов
/ 12 июля 2011

Похоже, вам нужно ввести строчную строку в метод lemmatize:

>>> WordNetLemmatizer().lemmatize('having','v')
'have'
>>> WordNetLemmatizer().lemmatize('has','v')
'have'
2 голосов
/ 12 июля 2011

Попробуйте использовать один из стеммеров в модуле nltk.stem , например PorterStemmer .Вот онлайн-демонстрация стеммеров NLTK: http://text -processing.com / demo / stem /

0 голосов
/ 15 апреля 2014

Нет, Wordnet не может остановить слова. Он может давать только лемматизированные слова, то есть слова, которые являются реальными словами в языке. Происходящий может не всегда давать по-настоящему значимые слова.

...