Использование SnowBallAnalyzer с PyLucene - PullRequest
1 голос
/ 08 мая 2011

Я пытаюсь использовать SnowBallAnalyzer в PyLucene, но всегда получаю сообщение об ошибке: InvalidArgsError, когда я пытаюсь создать его экземпляр следующим образом:

analyzer = SnowBallAnalyzer("Spanish")

или

analyzer = SnowBallAnalyzer("Spanish", STOPWORDS)

Что мне действительно нужно, то есть, если я ищу "Fútbol", я должен получить документы со словом "futbol" или "fútbol".Итак ... Я хотел бы применить SnowBallAnalyzer к тексту, который я хотел бы проиндексировать в запросе.

Любая помощь будет принята с благодарностью.

Заранее спасибо.

1 Ответ

1 голос
/ 08 мая 2011

Я не очень хорошо знаю пилицен, поскольку я работаю только с java-версией, но, насколько я знаю, pylucene получает доступ к реализации java.

В этом случае вам не хватает параметра Version в конструкторе.

SnowballAnalyzer(Version matchVersion, String name, String[] stopWords)

Поскольку SnowballAnalyzer устарел в lucene 3.1.0, я предлагаю вам напрямую использовать испанский анализатор.

SpanishAnalyzer(Version matchVersion, Set<?> stopwords) 
...