Правильная структура для различных значений атрибута в измерении - PullRequest
0 голосов
/ 28 сентября 2019

Я пытаюсь построить измерение Customer из примерно 5 наших базовых систем. У меня есть ситуация, когда каждая система имеет различную степень качества данных, и в результате я получаю разные значения для одних и тех же атрибутов в строках.

Мне нужно объединить строки в одну строку (так как это один и тот же клиент, и мне нужно иметь возможность объединить и сделать золотую запись)

Я использую MS SQL Server 2019.

Итак, мои данные выглядят примерно так (из исходной системы):

ClientID, PhoneNumber, Address, SourceSystemID
123, 63310042, '123 Test Street, Test Town, 2800,', SAP
123,+61310042,'123 test st, Test town 2800', Netsuite 

Мне интересно, какое лучшее средство здесь, потому что я хочу:

  1. гарантирует, что транзакции из исходной системы SAP и Netsuite отображаются при каждом просмотре этого клиента.

  2. Я также хочу анализировать географическую информацию, как.- они из «Тест-тауна»

...