Как добавить пропущенное слово в nltk WordnetLemmatizer? - PullRequest
0 голосов
/ 04 февраля 2020

Я пытаюсь сделать что-то основанное на текстовых исследованиях. У меня есть существующая кодовая база, которую я использовал в предыдущих исследованиях, используя WordNetLemmatizer из nltk, чтобы - среди прочего - получить форму единственного числа существительных во множественном числе. Пока это работает довольно хорошо.

Теперь я нашел существительное, которое WordNetLemmatizer не знает.

from nltk.stem import WordNetLemmatizer
>>> lemmatizer = WordNetLemmatizer()
>>> lemmatizer.lemmatize('coronaviruses')

Результат:

'коронавирусы '

Вывод, который я ожидаю, будет:

' коронавирус '

Он отлично работает с вирусами:

>>> lemmatizer.lemmatize('viruses')

'virus'

Можно ли как-то добавить коронавирусы / коронавирус к wor dnet?

...