Apache Cassandra запрос / полнотекстовый поиск - PullRequest
4 голосов
/ 10 августа 2010

Я играл с проектом Apache's Cassandra.Достаточно прочтено, и у меня есть несколько довольно сложных примеров, которые я сделал, включая вставку отдельных и пакетных наборов данных, получение одного и нескольких наборов данных на основе ключей.Некоторые из статей, на которые я смотрел, включают

http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example http://github.com/digg/lazyboy http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model http://www.sodeso.nl/?p=80

У меня довольно хорошийпонимание концепций, объясненных и даже реализовавших простое приложение.

Ни в одной из статей не описывается, как можно было бы выполнить запрос, когда, например, запрос является поисковым термином, введенным пользователем.

Кто-нибудь знает, как или может подсказать, как мне поступить с таким запросом?Или, возможно, способ создать поисковый индекс, полнотекстовый поиск или что-нибудь еще, даже удаленно закрытое?

1 Ответ

3 голосов
/ 10 августа 2010

Вы, вероятно, разделите текст на слова, а затем будете использовать эти слова в качестве ключей к вашему «индексу». Каждое слово будет содержать семейство упорядоченных по времени меток со списком идентификаторов ваших статей, сообщений и т. Д. Таким образом, вы можете выполнять только простой поиск по ключам (словам). При поиске более одного слова используйте пересечение по этим семействам столбцов.

Это очень простой подход, если вам нужны более сложные запросы, посмотрите на Lucandra - http://github.com/tjake/Lucandra - Lucandra - это полнотекстовая поисковая система с Cassandra в качестве внутреннего хранилища.

...