Хранилище данных: как называется официальное название цепной таблицы? - PullRequest
0 голосов
/ 28 марта 2019

В Китае chain table (拉链 表) - один из способов хранения данных в хранилище данных (HDFS). Другие методы включают инкрементную таблицу и таблицу моментальных снимков.

Для таблицы цепочек ее логика выглядит так:

(1) На начальном этапе клиент имеет баланс 100, поэтому конечная дата равна 2999/12/31

enter image description here

(2) Через некоторое время, после изменения баланса, данные станут

enter image description here

История и текущий статус сохраняются в одной таблице и более эффективны, чем ежедневный снимок.

Мои вопросы:

  • Какое официальное название для такой таблицы? Например, накапливая таблицу фактов? и какие-нибудь документы / книги для него?
  • Как будет выглядеть временной интервал при интеграции потоковых данных (как в https://eng.uber.com/uber-big-data-platform/ через Kafka)?
...