Я пытаюсь сделать что-то основанное на текстовых исследованиях. У меня есть существующая кодовая база, которую я использовал в предыдущих исследованиях, используя WordNetLemmatizer из nltk, чтобы - среди прочего - получить форму единственного числа существительных во множественном числе. Пока это работает довольно хорошо.
Теперь я нашел существительное, которое WordNetLemmatizer не знает.
from nltk.stem import WordNetLemmatizer
>>> lemmatizer = WordNetLemmatizer()
>>> lemmatizer.lemmatize('coronaviruses')
Результат:
'коронавирусы '
Вывод, который я ожидаю, будет:
' коронавирус '
Он отлично работает с вирусами:
>>> lemmatizer.lemmatize('viruses')
'virus'
Можно ли как-то добавить коронавирусы / коронавирус к wor dnet?