Преобразовать основанное слово в корневое (или не сопряженное) слово - PullRequest
0 голосов
/ 15 октября 2018

Я использую NLTK, чтобы извлечь слова из текста, и делаю некоторую базовую аналитику с этими словами.Однако для целей отображения я хочу преобразовать эти основы обратно в «корневое» слово (но не обратно в ту же форму или спряжение, с которого оно начиналось).Например:

>>> import nltk
>>> from nltk.stem import SnowballStemmer
>>> sn = SnowballStemmer("english")
>>> sn.stem("happiness")
u'happi'
>>> sn.stem("happy")
u'happi'

# What I want to do:
>>> some_unstem_function("happi")
u'happy'

Есть ли функция или метод для этого?

1 Ответ

0 голосов
/ 15 октября 2018

Есть разные стеммеры, которые вы можете попробовать.Онлайн-инструмент, который вы можете посоветовать, это this .Стеммер Ланкастера может помочь вам с вашим примером, но вы можете попробовать разные стеммеры и проверить, что лучше для вашей задачи.

from nltk.stem import lancaster
sn = lancaster.LancasterStemmer()
...