BI - дизайн таблицы фактов с несовместимыми зернами - PullRequest
0 голосов
/ 18 мая 2019

Я совершенно новичок в проектировании БД для BI, и здесь кое-что не очень хорошо понимаю. Я пытаюсь импортировать данные французской переписи, где я получил население для каждого города. Для каждого города у меня есть люди с разной возрастной классификацией, которые не могут быть связаны друг с другом.

Например, скажем, одной классификации от 00 до 20 лет, от 21 до 59 и 60+ И другой способ более точен: от 00 до 02, от 03 до 05 и т. Д., Но границы никогда не совпадают с первой классификацией: у меня не 15–20, а 18–22, например.

Так что эти 2 классификации несовместимы. Как я могу использовать их в моей таблице фактов? Должен ли я использовать 2 таблицы фактов и 2 куба? Должен ли я использовать одну таблицу фактов и 2 измерения для 1 куба? Но в этом случае у меня будет двойное количество фактов, когда я соберу все население города, не так ли?

Это данные национальных переписей и национальные классификации, поэтому изменение этого показателя или оценка численности населения для объединения этих классификаций не представляется возможным. И чтобы быть ясным, один ряд относится не к одному человеку, а к одному городу. Мои факты не люди, а население городов. Так что эта таблица похожа на: Строка 1: один город - одна численность населения - один код для неимущего возраста (например, от 00 до 19 лет) этой группы населения - код (m / f) для неясного пола этой группы населения - дата переписи Строка 2: тот же город - одно количество населения - один код для неимущего возраста (например, от 20 до 34) этого населения - код (m / f) для неясного пола - дата переписи И так для многих городов, как по полу, так и по нескольким годам. То же

Надеюсь, этот вопрос достаточно ясен, так как английский не является моим родным языком, а я довольно новичок в DB и BI!

Спасибо, что помогли мне с этим.

Ответы [ 2 ]

0 голосов
/ 28 мая 2019

Вы можете создать один размер, как показано ниже

молодые 1-20 взрослый 21-59 старший 60 +

Классификация молодой город 1: 1-20 молодой город 2: 4-23

 id  field1   field2         field3          field4  .......

 1   1 year   young_city_1   other           .......
 2   2 year   young_city_1   other           .......
 3   3 year   young_city_1   other           .......
 4   4 year   young_city_1   young_city_2    .......

Теперь вы можете сообщать о любом предмете и с любым делением

Я надеюсь, что это поможет вам

0 голосов
/ 24 мая 2019

Одно возможное решение с использованием одной таблицы фактов и двух измерений для возрастных диапазонов:

1 - Категориальный диапазон, основанный на самой широкой переписи, например:

  • Молодой 0-20
  • Взрослый 21-59
  • Старший 60 +

Затем вы можете связать другую перепись с этим измерением с приблизительными значениями, например, 18-22 могут быть Янгом.

2 - Оригинальный возрастной диапазон. Это измерение может использоваться для точных возрастных диапазонов при составлении отчета по одному городу, оно также может помочь вам оценить влияние перекрывающихся границ (например, сколько строк в диапазоне молодых / 18-22?)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...