Допустим, я получаю большое (2 миллиона строк?) Количество данных, которое должно быть статичным и неизменным. Должно быть. И эти данные публикуются ежемесячно. Какие методы доступны для 1) знать, какие точки данных менялись от месяца к месяцу и 2) использовать данные, данные на определенный момент времени?
Решение 1) Наивно сохраняйте каждый снимок данных, аннотированный по дате. Осведомленность о разнице обрабатывается некоторой внутренней программой, но потребление данных по дате тривиально. Минусы, требования к пространству аэростата на порядок.
Решение 2A) Используя внутреннюю программу, отследите, когда происходят различия, и сохраните их в таблице EAV с аннотацией по дате. Требования к пространству низки, но потребление, интегрированное с исходными данными, становится громоздким.
Решение 2B) Используя внутреннюю программу, отследите, когда происходят различия, и сохраните их в редко заполненной таблице, которая очень похожа на исходную таблицу, заполненную только измененными данными и датой. когда изменилось. Минусы, модель редкая, а потребление, интегрированное с исходными данными, нетривиально.
Я думаю, в основном, как мне интегрировать измерение времени в реляционную базу данных, учитывая как просмотр данных, так и понимание различий между периодами времени?
Относится ли это вообще к хранилищу данных?
Пахнет как ... Медленно меняющееся измерение?