У нас есть несколько исходных систем, отправляющих данные. В идеале мы должны собирать необработанные данные, поступающие из источников, и хранить их в озере данных. Затем мы должны обработать необработанные данные в структурированном формате. Теперь пользователи могут обновлять эти данные через приложение переднего плана.
Я думаю о том, чтобы поместить rdbms поверх обработанных данных, а затем перенести контрольные журналы из rdbms в озеро данных и объединить обработанные данные и контрольные журналы, чтобы создать окончательное представление для отчетов. Или rdbms также можно использовать для аналитики.
Или мы можем ввести все данные, изначально находящиеся в rdbms, выполнить изменения в rdbms и извлечь данные из rdbms в озеро данных. Но вводить озеро данных не имеет особого смысла.
Пожалуйста, предложите.
Спасибо