Я ищу алгоритм определения словенского языка, который можно использовать в поиске Сфинкса.
Я пытаюсь добиться, например, поиска «jabolka», я также хочу получить результаты для документов, содержащих «jabolko», «jabolki», «jabolk» и т. Д.
Я нашел некоторые упоминания о существовании словенского стеммера, но не могу найти, где его скачать, он даже нигде не продается ...
Еще одна опция, с которой я столкнулся, - это использование опции wordforms
в исходной конфигурации Sphinx (http://sphinxsearch.com/docs/manual-0.9.9.html#conf-wordforms),, но создание моего собственного словаря было бы слишком сложным, поэтому мне интересно, есть ли уже доступные публичные словари
В случае отсутствия словенского стеммера, может кто-нибудь предложить какой-то другой подход для получения похожих результатов поиска?