Как получить инфинитивную форму глагола, используя NLTK (pos tagging) - PullRequest
8 голосов
/ 19 марта 2012

Я пытаюсь выучить обработку естественного языка (английского) с использованием NLTK и Python.Есть ли способ получить инфинитивную форму глагола во время или после POS-тегирования.

Например:

  • is (VBZ) => быть
  • предоставлено (VBN) => для предоставления
  • с использованием (VBG) => для использования

1 Ответ

16 голосов
/ 19 марта 2012

Закрыть, вам нужно добавить «к» в начале:

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lemmatizer = WordNetLemmatizer()
>>> lemmatizer.lemmatize('is', 'v')
'be'
>>> lemmatizer.lemmatize('provided', 'v')
'provide'
>>> lemmatizer.lemmatize('using', 'v')
'use'
...