Как Cassandra обрабатывает дублированные данные при чтении из SSTable - PullRequest
0 голосов
/ 05 декабря 2018

В документации Datastax говорится:

Во время записи Кассандра добавляет каждую новую строку в базу данных, не проверяя, существует ли дублирующаяся запись.Эта политика делает возможным, что много версий одной и той же строки могут существовать в базе данных.

Насколько я понимаю, это означает, что возможно существует более 1 неуплотненнойSSTables, которые содержат разные версии одной и той же строки.Как Cassandra обрабатывает дублированные данные при чтении данных из этих таблиц SSTable?

1 Ответ

0 голосов
/ 05 декабря 2018

@ quangh: Как уже указано в документе:

This is why Cassandra performs another round of comparisons during a read process. When a client requests data with a particular primary key, Cassandra retrieves many versions of the row from one or more replicas. The version with the most recent timestamp is the only one returned to the client ("last-write-wins").

Все операции записи имеют временную отметку.В этом случае разные узлы будут иметь разные версии одной и той же строки.Но во время операции чтения Кассандра выберет строку с последней отметкой времени.Я надеюсь, что это решает ваш запрос.

...