Справка Sphinx + NoSQL - PullRequest
       7

Справка Sphinx + NoSQL

1 голос
/ 17 августа 2010

Итак, я хочу запустить Sphinx в системе NoSQL, такой как MongoDB, HBase, Cassandra и т. Д.

Сейчас мы сравниваем все системы NoSQL. По сути, нам нужно запрашивать более 50 миллионов строк данных о продукте с полнотекстовым поиском тысячи раз в секунду, поэтому мы пытаемся найти наиболее эффективную систему NoSQL.

Вот наш вопрос. Если мы используем любую систему NoSQL с Sphinx, когда мы выполняем фактический поиск, будет ли поиск иметь какое-либо взаимодействие с самой системой NoSQL, или Sphinx будет выполнять работу, так как он проиндексировал данные? Если это только Sphinx, то производительность системы NoSQL не будет вторичной?

Спасибо!

Ответы [ 2 ]

0 голосов
/ 07 декабря 2012

Как я понимаю, я думаю, что вы можете сделать это. Поскольку я знаком только с mongodb и hbase, я могу говорить только об этом вопросе, основываясь на двух базах данных. Вам нужно поработать над индексатором и встроить данные / атрибуты в файл индекса sphinx, а также включить в него первичный ключ (который отмечает единственную запись в базе данных) (для mongodb, это object_id, для hbase это ключ строки), то после выполнения полнотекстового поиска вы можете получить все данные / атрибуты из баз данных по первичному ключу.

Кроме того, другая система полнотекстового поиска отлично поддерживает no-sql db, это solr. Вы можете попробовать это, если выполнение этого может удовлетворить ваш запрос.

0 голосов
/ 17 августа 2010

Используя последний строковый атрибут, вы можете полностью вырезать часть поиска в базе данных, что будет намного эффективнее.

...