Как создать таблицу фактов из нескольких разных таблиц в Пентахо - PullRequest
0 голосов
/ 05 мая 2019

Я следовал учебному пособию по созданию хранилища данных с использованием Pentaho Data Integration / Kettle.

Учебное пособие основано на файле CSV, но я тренируюсь с базой данных northwinds и postgresql. Я пытаюсь выяснить, как выбирать значения из более чем одной таблицы, а затем выводить их в одну таблицу.

Мой процесс ETL идет следующим образом: у меня есть несколько этапов для каждой таблицы, значения выбираются из каждой таблицы и сохраняются в таблице этапов для каждой таблицы в базе данных, оттуда у меня настроена таблица измерений, но я пытаюсь чтобы выяснить шаг между этапами и измерениями, где я пытаюсь выбрать значения для обновления таблицы измерений.

На данный момент у меня есть несколько этапов для каждой из моих таблиц. Я не уверен, стоит ли мне создавать отдельную таблицу значений для каждой таблицы или одну таблицу значений. Любая помощь будет принята с благодарностью. Спасибо

Когда я пытаюсь выбрать значения из нескольких таблиц, я получаю сообщение об ошибке «мы обнаружили строки с различным количеством полей». Кажется, мне нужно создать отдельные таблицы с

1 Ответ

0 голосов
/ 05 мая 2019

В kette структура метаданных потока данных не может измениться. Таким образом, если строка 1 имеет 3 столбца, например одно целое и две строки, все строки должны иметь одинаковую структуру.

Если вы комбинируете строки, поступающие из разных источников, вы должны убедиться, что структура одинакова. Эта ошибка говорит о том, что некоторые из входящих потоков данных имеют разное количество полей.

...