Как сделать стеммизацию телугу с помощью Java Lucene? - PullRequest
0 голосов
/ 27 ноября 2018

Как сделать стеммизация из Язык телугу с использованием Java Lucene?

1 Ответ

0 голосов
/ 18 декабря 2018

К сожалению, для языка телугу нет встроенного стеммера (как у хинди).Это означает, что если вы хотите сделать несколько телугу, вам нужно будет реализовать этот компонент самостоятельно.

Хорошей отправной точкой было бы взглянуть на эту презентацию и включить эти методы в Lucene.TokenFilter.

Написание собственного TokenFilter не так сложно, как кажется.Вы можете посмотреть примеры здесь

...