Польский поиск сфинкса? - PullRequest
5 голосов
/ 03 февраля 2011

Я хочу реализовать поисковое решение для веб-сайта, написанного на Django. Из доступных опций (я исследовал Solr, Sphinx, Xapian, PostgreSQL / Tsearch3, MySQL) Sphinx выглядит как самый хороший. Тем не менее, он не поддерживает stemming для польского языка, и это язык данных, который я хочу сделать доступным для поиска.

Каковы лучшие способы работы с неподдерживаемыми языками в Sphinx? У меня есть интуиция, что я мог бы создать сводный корпус из словаря Ispell. Как я могу заставить это работать со Sphinx?

1 Ответ

0 голосов
/ 26 сентября 2011

Поиск в http://snowball.tartarus.org/ mailist, вы можете найти некоторую информацию, если кто-то попытается создать польский стеммер.Доступно 2 бесплатных стеммера, но они сделаны в Java (я думаю, что по крайней мере один сделан для solr / lucene).От Ispell я не уверен, может ли вам помочь стволовый корпус, вы могли бы создавать файлы, которые будут использоваться для словоформ или исключений.

...