Я создаю атм для сайта, который требует индексации результатов в реальном времени (не 10000 документов в секунду, я имею в виду обновления в миллисекундах). Я продолжал исследовать различные технологии и первоначально придумал десятки различных платформ. Я смог сузить свой выбор до 3 с помощью дедукции (сложность документа, различные виды поддержки и т. Д.):
Изначально я пытался выбирать между этими сайтами, используя их, но затем, к моему удивлению, многие и многие громкие сайты доверяют всем этим. Я также обнаружил, что все три из них также допускают обновления в миллисекундах.
Первоначально я думал о Sphinx, потому что он единственный из трех, кто говорит о полной индексации в реальном времени, а не почти в реальном времени, только чтобы обнаружить, что она все еще находится в стадии бета-тестирования (не уверен, насколько надежной будет эта технология при индексировании в реальном времени, tbh).
Я склоняюсь к lucene, поскольку, когда solr получает индексирование в реальном времени, перемещение моей схемы в solr будет безумно легким.
Я также склоняюсь к Xapian, потому что ряд сайтов, которые я знаю, реализуют его очень хорошо.
У меня огромные проблемы с выбором этих технологий и какой из них лучше всего подойдет.
Я смотрю сайт с миллионами, может быть, даже десятками миллионов записей, которым нужен индекс, который можно добавлять / удалять / обновлять в реальном времени.
Может ли кто-нибудь поделиться своим опытом работы с поисковыми платформами в реальном времени, чтобы помочь мне выбрать подходящую для меня? Я открыт для предложений, которых здесь нет:).
P.S Я использую MongoDB, поэтому не размещайте поисковые платформы только на SQL, пожалуйста:).