Xapian больше похож на Lucene, библиотеку, которую вы интегрируете в свое приложение. Если у вас есть приложение на C ++, то Xapian может быть лучше. Если у вас есть Java-приложение, Lucene почти наверняка является лучшим выбором.
Если вам нужен поисковый сервер, сравните Omega (построенный на Xapian) с Solr (построенный на Lucene). Я не использовал Omega или Xapian, но у Solr есть несколько особенностей, от которых я стал зависеть, особенно цепочки анализа для каждого поля. Это блестящая идея, о которой я хотел бы подумать, работая над Ultraseek.
Довольно просто расширить цепочку анализа Solr вашим собственным классом Java. Я ожидаю, что это будет сложнее в C ++ с Omega / Xapian.
Два движка используют разные базовые модели релевантности. Xapian - вероятностный двигатель, Lucene - векторный космический двигатель. Я видел, как обе модели настроены так, чтобы они работали хорошо, поэтому это может быть не повод для принятия решения.
Сообщество Solr / Lucene большое и очень полезное.