Excel в CSV плагин для чайника - PullRequest
1 голос
/ 10 марта 2020

Я пытаюсь разработать повторно используемый компонент в Пентахо, который возьмет файл Excel и преобразует его в CSV с опцией кодирования.

Короче говоря, мне нужно разработать преобразование с входом Excel и выход CSV. Я не знаю столбцы заранее. Столбцы должны динамически вводиться в исходные данные Excel.

Ответы [ 3 ]

1 голос
/ 25 марта 2020

Это идеальный кандидат для инъекции метаданных Пентахо . У вас должно быть преобразование шаблона, которое содержит основной рабочий процесс c (чтение из Excel, запись в текстовый файл), но без указания форматов ввода и / или вывода. Затем вы должны хранить свои метаданные (список столбцов и их свойства) где-то. В примере с Pentaho используется таблица Excel, но вы этим не ограничены. Я использовал пару таблиц базы данных для хранения метаданных, например, одну для входного формата и другую для выходного формата.

Кроме того, вам необходимо выполнить преобразование, содержащее шаг «Внедрение метаданных», чтобы «внедрить» метаданные в преобразование шаблона. По сути, он создает новое преобразование во время выполнения, используя шаблон и поля, которые вы задали для заполнения, а затем запускает его.

Пример Pentaho довольно ясен, если вы будете следовать ему шаг за шагом шаг, и из этого вы можете создать более сложное решение.

0 голосов
/ 03 апреля 2020

Итак, вот решение. В своем компоненте ввода Excel в разделе «Поля» укажите максимальное количество полей, которые будут в любом Excel. Затем направьте входной Excel в текстовое поле на основе количества полей, которые действительно присутствуют. Вам нужно сыграть здесь переключатель / кейс. ETL-CODE

0 голосов
/ 10 марта 2020

Для преобразования потребуется по крайней мере два шага:

Шаг ввода: ввод Microsoft Excel

Шаг вывода: вывод текстового файла

enter image description here

...