Эффективный лемматизатор, позволяющий избежать поиска в словаре - PullRequest
7 голосов
/ 12 декабря 2011

Я хочу преобразовать строку типа «есть» в «есть», «ест».Я искал и нашел лемматизацию как решение, но все инструменты лемматизации, с которыми я сталкивался, используют список слов или поиск по словарю.Есть ли лемматизатор, который избегает словарный поиск и дает высокую эффективность, может быть лемматизатором, основанным на правилах.Да и я не ищу "Стеммер".

1 Ответ

1 голос
/ 12 декабря 2011

Вы можете попробовать LRBL : основанный на правилах лемматизатор

Используется концепция рекурсивных аббревиатур.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...