База данных Zend Lucene и MySql - PullRequest
2 голосов
/ 20 апреля 2011

У меня есть веб-сайт PHP с данными, хранящимися в базе данных MySql. (около 50 000 статей) Я хочу улучшить результаты функции полнотекстового поиска и прекратить использовать простой запрос LIKE.

Я считаю Zend_Search_Lucene из среды Zend отличным инструментом.

Считаете ли вы, что Zend Search Lucene - хороший выбор в моем случае?

После индексирования всех моих статей с помощью lucene, нужно ли мне хранить данные в MySql, или для того, чтобы сохранить все данные, достаточно Zend Search lucene?

Заранее спасибо,

Ответы [ 2 ]

3 голосов
/ 20 апреля 2011

Я бы выяснил, удовлетворяет ли ваш MySQLs Полнотекстовый поиск вашим потребностям, прежде чем переходить к решению на основе Lucene.Это значительное улучшение при использовании операторов LIKE без дополнительной реализации, необходимой для Lucene.

Zend_Search_Lucene - это чистая реализация Lucene на PHP и, следовательно, может быть довольно медленной при использовании с большими наборами данных.Я бы пропустил это и посмотрел на реализацию Apache Solr .Для него есть расширение PECL, которое задокументировано здесь .

2 голосов
/ 26 июля 2011

Я использовал полный текст MySQL на более чем 200 000 документов с хорошим объемом данных, и время моего поиска составляет от 0,5 до 2 секунд на популярных терминах и очень редкий 5 или 6-секундный ответ время от времени.Я обновляю некоторые данные каждый день, так что долгосрочное кэширование не работает лучше, но если бы я мог кэшировать результаты поиска, я мог бы просматривать 0,2 секунды или меньше после кэширования.

Я тестирую переход на Zend Luceneи до сих пор те же поиски выполняются менее чем за 1,5 секунды для наиболее часто используемых терминов.

Все вышеперечисленное находится на выделенном сервере с 2 гигабайтами оперативной памяти и дуэтом с ядром 2.

Я не эксперт, но для 50 000 статей я согласен с Треффинноном, чтобы вместо этого проверить полнотекстовый поискиспользования как.Если вы перейдете на новую версию Zend Lucene, я думаю, что индексы совместимы с java-версией, так что это может стать хорошим шлюзом, если в будущем вы добавите больше статей и вам понадобится больше скорости?

...