Как вы узнаете, из какого источника поступают записи в таблице измерений? - Хранилище данных - PullRequest
0 голосов
/ 25 февраля 2020

У меня есть 3 университетские базы данных, из которых я загружаю данные в свои таблицы измерений хранилища данных. Поскольку все 3 источника будут в одной и той же таблице измерений, как я узнаю, какие строки из какого университета? Например; если бы я хотел запросить стенограмму одного студента из определенного c университета в течение нескольких семестров, в моей таблице фактов (fact_transcript) я мог бы различить guish, используя уникальный номер социального страхования студента (ssn) или я мог бы добавить университетский атрибут в таблицу фактов (но я не думаю, что это правильно), но для моей таблицы курса и других; если все 3 университета имеют одинаковые номера курсов (например, 1, 2, 3 ...), я не знаю, какие курсы принадлежат какому университету, чтобы я мог правильно загрузить студентов и курс в таблицу фактов. У меня было бы что-то вроде этого для измерения курса:

COURSE

course_id | c_name | cr_hours ...

1 | from_university_1 | 3
2 | from_university_1 | 3
3 | from_university_1 | 3
1 | from_university_2 | 3
2 | from_university_2 | 3
3 | from_university_2 | 3
1 | from_university_3 | 3
2 | from_university_3 | 3
3 | from_university_3 | 3

Имена могут быть одинаковыми или разными, я просто выбрал их, чтобы показать вам, что я имею в виду. Буду ли я преобразовывать идентификаторы в диапазон от 1-1000 для uni1, затем 1001-2000 для uni2 и т. Д., Или я добавлю аббревиатуру перед каждым названием курса (и сделаю то же самое для других измерений), как; UNI1-кодовое имя, UNI2-кодовое имя? Спасибо за любую помощь.

...