Xapian против Apache Solr - PullRequest
       15

Xapian против Apache Solr

9 голосов
/ 29 ноября 2011

Я пытаюсь получить хороший поиск по естественному языку на веб-сайте и пытаюсь понять преимущества Apache Solr против Xapian. Xapian кажется проще в настройке. Оба предлагают хороший поиск на естественном языке? Любое понимание приветствуется.

1 Ответ

7 голосов
/ 12 апреля 2012

Xapian больше похож на Lucene, библиотеку, которую вы интегрируете в свое приложение. Если у вас есть приложение на C ++, то Xapian может быть лучше. Если у вас есть Java-приложение, Lucene почти наверняка является лучшим выбором.

Если вам нужен поисковый сервер, сравните Omega (построенный на Xapian) с Solr (построенный на Lucene). Я не использовал Omega или Xapian, но у Solr есть несколько особенностей, от которых я стал зависеть, особенно цепочки анализа для каждого поля. Это блестящая идея, о которой я хотел бы подумать, работая над Ultraseek.

Довольно просто расширить цепочку анализа Solr вашим собственным классом Java. Я ожидаю, что это будет сложнее в C ++ с Omega / Xapian.

Два движка используют разные базовые модели релевантности. Xapian - вероятностный двигатель, Lucene - векторный космический двигатель. Я видел, как обе модели настроены так, чтобы они работали хорошо, поэтому это может быть не повод для принятия решения.

Сообщество Solr / Lucene большое и очень полезное.

...