Что лучше иметь две отдельные таблицы для меньшего размера, чем одна большая таблица в Кассандре? - PullRequest
1 голос
/ 19 марта 2020

У меня есть ситуация, когда у меня есть возможность иметь две отдельные таблицы с первичным ключом, состоящим из двух столбцов, ИЛИ одну таблицу с данными из предыдущей таблицы, где первичный ключ представляет собой комбинацию из трех столбцов.

Какая опция лучше для базы данных с интенсивным чтением в Кассандре.

Ответы [ 2 ]

1 голос
/ 19 марта 2020

Попытайтесь создать таблицу, в которой вы можете удовлетворить свой запрос, прочитав (грубо) один раздел

На практике это обычно означает, что вы будете использовать примерно одну таблицу на шаблон запроса. Если вам нужно поддерживать несколько шаблонов запросов, вам обычно требуется более одной таблицы. Иными словами, каждая таблица должна предварительно составить «ответ» на высокоуровневый запрос, который вам необходимо поддерживать. Если вам нужны разные типы ответов, вам обычно нужны разные таблицы. Вот как вы оптимизируете для чтения. Помните, дублирование данных в порядке. Многие из ваших таблиц могут повторять одни и те же данные.

https://www.datastax.com/blog/2015/02/basic-rules-cassandra-data-modeling

Это уже получено, Кассандра - одна большая таблица против многих таблиц

0 голосов
/ 20 марта 2020

Вы можете использовать оба сценария, но вам нужно следовать рекомендациям, рекомендованным Datastax или Apache Cassandra. Вы можете ссылаться на базовое руководство c, как показано ниже: - http://cassandra.apache.org/doc/latest/data_modeling/index.html или https://www.datastax.com/blog/2015/02/basic-rules-cassandra-data-modeling

Но для приложений с интенсивным чтением вам нужно много вещей, таких как свойства уплотнения , свойства таблицы, индексы, разделы и т.д. c тоже. Если ваши таблицы становятся большими, вы должны позаботиться о свойствах разделов. Надеюсь, это поможет вам.

...