Я использовал расширения Lucene и Lucene, такие как SOLR и Nutch, и обнаружил, что Lucene в значительной степени удовлетворяет то, что мне нужно.Я попробовал Whoosh только один раз, но выбрал Lucene, потому что 1) я использую Java 2) у меня были проблемы с настройкой UTF-8 для работы с Whoosh (не уверен, работает ли он сейчас из коробки).В Lucene у меня не было проблем с работой с китайскими иероглифами.
Если вы используете Python в качестве языка программирования и Whoosh удовлетворяет ваши потребности, то я бы предложил вам использовать его вместо альтернатив Java для лучшей интеграции, избегая внешнихзависимости, более быстрая настройка, если вам нужно кодировать дополнительные функции.
ОБНОВЛЕНИЕ: Если вы заинтересованы в использовании Lucene, у него есть оболочка Python: см. http://lucene.apache.org/pylucene/