Lucene 2.2 Арабский анализатор - PullRequest
3 голосов
/ 30 мая 2010

Можно ли изменить Lucene 2.2 для добавления арабского анализатора, и если кто-то уже сделал это, где я могу получить source / jar

Ответы [ 3 ]

1 голос
/ 30 мая 2010

кто-то раньше спрашивал меня, как получить арабскую и персидскую поддержку на люцене 2.4

, так что они были неофициально перенесены сюда: http://people.apache.org/~rmuir/

http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch

это означает, что вам нужно всего лишь обновить до 2.4.1, что может быть проще, чем до 2.9 или 3.0.

надеюсь, это поможет

1 голос
/ 30 мая 2010

Lucene 3.0.1 имеет Арабский анализатор . Он находится в пакете contrib .

Вы можете перейти на Lucene 3.0.1, чтобы получить эту работу из коробки. Вы, вероятно, не сможете использовать это, как для Lucene 2.2, так как API TokenStream изменились в этом выпуске. Но перенести изменения в 2.2 не должно быть очень сложно, если вы не хотите переходить на последнюю версию Lucene.

0 голосов
/ 30 мая 2010

В качестве альтернативы, вы можете попробовать использовать lucene-hunspell для анализатора. В настоящее время это работает со стволом Lucene - я не знаю, работает ли он с Lucene 3.0.1. Вот объяснение Роберта Мьюра и список словарей, включая арабский . Я верю, что вы также можете поддержать это. Предложение Шашиканта кажется более легким для реализации, в то время как это может быть более качественным.

...