По общему признанию похоже на (но не дубликат) Сравнение полнотекстового поискового движка - Lucene, Sphinx, Postgresql, MySQL? , однако, что я ищу, так это конкретные, поддерживаемые, рекомендации, основанные на опыте использования более чем одной из доступных систем (кажется, что есть много: «Я использовал lucene, но не sphinx», и наоборот).
Настройка: Стандартная ЛАМПА (Mysql 5.0, PHP 5).
MySQL: таблицы используют механизм InnoDB для ограничений внешнего ключа
Мы смотрим на данные индексации, а не на страницы. данные для индексирования могут быть на нескольких языках (кодировка utf-8)
Ряд сравнений, с которыми я столкнулся (например, http://blog.evanweaver.com/articles/2008/03/17/rails-search-benchmarks/), либо не совсем применим (ferret - это порт lucene, но не совпадает с Zend_Search_Lucene), либо они выдвигают свои собственные системы / реализации (не абсолютно непредвзято).
Некоторые другие, с которыми я сталкивался (например, http://whatstheplot.com/blog/tag/lucene/ и http://pagetracer.com/2008/02/15/sphinx-and-lucene-search-engines-first-impressions/), дают очень разные результаты для производительности двух систем.
Кроме того, почти все, что я прочитал, почти игнорируется: Xapian . Может быть, это стоит рассмотреть?
Итак ... Я надеюсь, что некоторые из вас здесь на SO имеют некоторый опыт в этом вопросе и могли бы помочь с некоторыми рекомендациями или указать мне верное направление.