Я хочу вернуть исходные слова.
Я знаю, используя модуль nltk
, я могу лемматизировать слова
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemmatizer.lemmatize(str)
Мне могут потребоваться другие аргументы, такие как:
lemmatizer.lemmatize(str. "a")
или
lemmatizer.lemmatize(str, "v")
Но проблема в том, что у меня нет целого предложения для токенизации.
Я хочу ввести слово, оно возвращает исходные слова без предложениятокенизация.
Я хочу:
был -> быть
сильнейшим -> сильным
сломался -> сломался
поцелуев ->поцелуй