Предложить модель данных Cassandra для существующей схемы - PullRequest
10 голосов
/ 19 марта 2010

Я надеюсь, что есть кто-то, кто может помочь мне предложить подходящую модель данных для реализации с использованием базы данных nosql Apache Cassandra. Больше, чем мне нужно, чтобы работать при высоких нагрузках и больших объемах данных.

Упрощенно У меня есть 3 типа объектов:

  • Продукт
  • Tag
  • ProductTag

Продукт:

key - string key
name - string
.... - some other fields

Метка:

key - string key
name - unique tag words

ProductTag:

product_key - foreign key referring to product
tag_key  - foreign key referring to tag
rating - this is rating of tag for this product

У каждого товара может быть 0 или много тегов. Тэг может быть присвоен 1 или нескольким товарам. Соотношение между продуктами и тегами означает «многие ко многим» с точки зрения реляционных баз данных.

Значение «рейтинг» обновляется «очень» часто.

Мне нужно выполнить следующие запросы

  • Выбор объектов клавишами
  • Выберите теги для товара, упорядоченного по рейтингу
  • Выбор товаров по тегу Порядок по рейтингу
  • Обновить рейтинг по product_key и tag_key

Самое главное, чтобы эти запросы выполнялись действительно быстро на больших объемах данных, учитывая, что рейтинг постоянно обновляется.

1 Ответ

2 голосов
/ 19 марта 2010

Примерно так:

Products : { // Column Family  
    productA : { //Row key  
        name: 'The name of the product' // column
        price: 33.55 // column
        tags : 'fun, toy' // column
    }  
}

ProductTag : { // Column Family
    fun : { //Row key
        timeuuid_1 : productA // column
        timeuuid_2 : productB // column
    },
    toy : { //Row key
        timeuuid_3 : productA // column
    }
}

UPDATE
Отметьте Модель, чтобы сохранить наибольшее количество баллов

...