Может ли PHP Zend Lucene обрабатывать индексы более 1 миллиона документов? - PullRequest
0 голосов
/ 10 июня 2011

Кто-нибудь знает, имеет опыт использования PHP Zend Lucene (поисковая система) с хранилищами более 1 миллиона.

Спасибо за ваш отзыв

Индексирование с помощью PHP Lucene с Java

Ответы [ 3 ]

0 голосов
/ 11 июня 2011

Многое зависит от архитектуры вашего приложения, но я не буду беспокоиться о количестве элементов.Известно, что Lucene работает медленно (строит индексы) в очень крупных проектах, но имеет хорошее обновление до Solr .

Solr - популярная, блестящаябыстрая корпоративная поисковая платформа с открытым исходным кодом из проекта Apache Lucene.Его основные функции включают мощный полнотекстовый поиск, выделение совпадений, граненый поиск, динамическую кластеризацию, интеграцию с базой данных, обработку документов с расширенными возможностями (например, Word, PDF) и геопространственный поиск.Solr обладает высокой масштабируемостью, обеспечивает распределенный поиск и репликацию индексов, а также поддерживает функции поиска и навигации на многих крупнейших мировых интернет-сайтах.

0 голосов
/ 11 июня 2011

У меня нет прямого опыта, но я видел жалобы на то, что Zend Lucene медленен и потребляет много памяти, настолько, что он действительно терпит неудачу с «большими» индексами и «маленькими» ограничениями памяти.Конечно, суть проблемы заключается в том, что составляет большой индекс и небольшое ограничение памяти.

Следующие два потока содержат некоторые особенности, которые, по-видимому, предполагают, что 1 миллион документов, вероятно, будет проблемой:

Другие разработчикиКого я очень хорошо говорю о Sphinx как по скорости, так и по памяти.

Лично я рассматриваю возможность попробовать Zend Lucene в небольшом проекте - вероятно, не более 1000 документов в индексе, потому чтоЯ ограничен общим хостингом (насколько я понимаю, Sphinx требует внешнего демона).Но я все еще скрещиваю пальцы.

0 голосов
/ 10 июня 2011

Я думаю, что если вам нужна хорошая производительность, вы можете рассмотреть возможность использования sphinx поверх PHP Zend Lucene, если ваш проект не требует индексов Lucene.

Когда я смотрел на это примерно год назад, я обнаружил несколько тестов, сравнивающих PHP Lucence против sphinx. Сфинкс победил длинным выстрелом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...