Лучшая поисковая платформа в реальном времени для индексации больших БД в реальном времени? - PullRequest
0 голосов
/ 12 августа 2011

Я создаю атм для сайта, который требует индексации результатов в реальном времени (не 10000 документов в секунду, я имею в виду обновления в миллисекундах). Я продолжал исследовать различные технологии и первоначально придумал десятки различных платформ. Я смог сузить свой выбор до 3 с помощью дедукции (сложность документа, различные виды поддержки и т. Д.):

  • Lucence
  • Xapian
  • Sphinx

Изначально я пытался выбирать между этими сайтами, используя их, но затем, к моему удивлению, многие и многие громкие сайты доверяют всем этим. Я также обнаружил, что все три из них также допускают обновления в миллисекундах.

Первоначально я думал о Sphinx, потому что он единственный из трех, кто говорит о полной индексации в реальном времени, а не почти в реальном времени, только чтобы обнаружить, что она все еще находится в стадии бета-тестирования (не уверен, насколько надежной будет эта технология при индексировании в реальном времени, tbh).

Я склоняюсь к lucene, поскольку, когда solr получает индексирование в реальном времени, перемещение моей схемы в solr будет безумно легким.

Я также склоняюсь к Xapian, потому что ряд сайтов, которые я знаю, реализуют его очень хорошо.

У меня огромные проблемы с выбором этих технологий и какой из них лучше всего подойдет.

Я смотрю сайт с миллионами, может быть, даже десятками миллионов записей, которым нужен индекс, который можно добавлять / удалять / обновлять в реальном времени.

Может ли кто-нибудь поделиться своим опытом работы с поисковыми платформами в реальном времени, чтобы помочь мне выбрать подходящую для меня? Я открыт для предложений, которых здесь нет:).

P.S Я использую MongoDB, поэтому не размещайте поисковые платформы только на SQL, пожалуйста:).

Ответы [ 2 ]

0 голосов
/ 19 августа 2011

Я отвечаю на этот вопрос тем, что, как я обнаружил, через пару недель было лучшим вариантом.

Я нашел Lucene лучшим, так как база пользователей Zoies была ..... **. Я хотел опубликовать тему в группе Google (единственная форма поддержки), и через пару недель она все еще не прошла модерацию и не была одобрена для отображения.

Это действительно оттолкнуло меня от Зои, так что в конце я решил попробовать Люсена.

Спасибо в любом случае:).

0 голосов
/ 13 августа 2011

Я бы порекомендовал Зои на основе люцена.

...