Прослеживаемость данных для идентификации данных, переданных для расчета - PullRequest
0 голосов
/ 05 июня 2018

Нам необходимо выполнить определенные вычисления для набора транзакций с использованием настраиваемой логики (будет написано на Java или Python).

Расчеты будут выполняться для транзакций за определенный период (например, с 1 января по 31 января 2017 года).) и по состоянию на момент расчета, например, 31 января 2018 года.Пользователи могут добавлять (или отменять) транзакции с задним числом в любое время.Будет несколько сотен тысяч транзакций, и расчеты могут выполняться несколько раз за один и тот же период времени.Следовательно, предприятию необходимо знать, какие транзакции использовались для выполнения какого расчета.

Кто-нибудь знает, существуют ли какие-либо инструменты, которые могут помочь в этой прослеживаемости данных идентифицировать данные, которые использовались для конкретного вычисления?

Я думаю, что это трудно для любого инструмента, поскольку наш пользовательский код знает данные, которые он использовал.

Мы думаем о сохранении транзакций (только идентификаторов), относящихся к каждому вычислению, в базе данных, которая может использоватьсяинструменты визуализации данных по бизнесу.Учитывая объем транзакций, это займет время (может быть в часах), чтобы вставить эти многочисленные записи, но это будет приемлемо.

Я буду признателен, если кто-то, кто сталкивался с подобной проблемой, сможет поделиться своим опытом и как это было решено,Я не уверен, есть ли какой-либо стандартный образец, поскольку это, вероятно, не распространенная проблема.

Спасибо

...