В Китае chain table
(拉链 表) - один из способов хранения данных в хранилище данных (HDFS). Другие методы включают инкрементную таблицу и таблицу моментальных снимков.
Для таблицы цепочек ее логика выглядит так:
(1) На начальном этапе клиент имеет баланс 100, поэтому конечная дата равна 2999/12/31
(2) Через некоторое время, после изменения баланса, данные станут
История и текущий статус сохраняются в одной таблице и более эффективны, чем ежедневный снимок.
Мои вопросы:
- Какое официальное название для такой таблицы? Например, накапливая таблицу фактов? и какие-нибудь документы / книги для него?
- Как будет выглядеть временной интервал при интеграции потоковых данных (как в https://eng.uber.com/uber-big-data-platform/ через Kafka)?