Советы по настройке starscheme для длинных и широких исходных файлов - PullRequest
0 голосов
/ 17 апреля 2019

Я пытаюсь настроить решение ETL для назначения.Файлы исходных данных представляют собой файлы CSV длиной более 150 столбцов и длиной более 2000 строк.Файлы тестируют результаты.Каждый столбец (кроме первых нескольких) содержит значения тестирования от 1 элемента.Что означает около 135 предметов в общей сложности.каждая строка содержит уникальный тест

Файлы содержат 3 строки, которые определяют местоположение элемента с помощью имени, местоположения x и местоположения y.

Мой вопрос: как бы вы посоветовали мне при созданиизвездная схема для чего-то вроде этого?Поскольку одна вещь, идентифицирующая каждый элемент, хранится в 3 строках.

Всего существует несколько тестов, что означает, что таблица фактов должна объединять эти результаты тестов, чтобы их можно было сравнивать.это будет означать, что в сочетании с измерениями одна таблица фактов составляет около 450 столбцов?

Спасибо, что прочитали, надеюсь, мои объяснения достаточно ясны.

...