Pentaho Data Integration Преобразование данных в поле - PullRequest
0 голосов
/ 01 февраля 2020

Я новичок в использовании Pentaho и собираюсь взять некоторые исходные данные Excel и отобразить их в файл .csv. Имена полей в исходном и целевом файлах различаются, поэтому мне нужно выполнить некоторое сопоставление данных и, возможно, манипулирование данными.

1) Как настроить отображение поля на поле в инструменте? 2) Что мне нужно сделать для манипулирования данными на уровне поля?

Ответы [ 2 ]

1 голос
/ 01 февраля 2020

Pentaho Data Integration имеет более 300 шагов для выполнения преобразования данных. Предложить конкретный шаг c без точного требования невозможно. Какие манипуляции вы пытаетесь сделать? Убирать нули? Конкатенация строк? Изменить формат даты? Фильтр на основе регулярных выражений? Et c, et c. Потратьте время на изучение левой боковой панели при редактировании преобразования и посмотрите, какие шаги доступны. Скорее всего, все, что вы думаете делать, реализовано хотя бы одним из них.

Повторное изменение имен полей: вам не нужно сохранять имена полей, как они есть в заголовке файла Excel. Вы можете прямо дать им имена, которые вы хотите. И на выходе вам не нужно поддерживать порядок полей, вы можете переключать их по желанию.

Кроме того, вы можете использовать шаг Выбрать значения и переименовать / изменить порядок полей в соответствии с вашими потребностями.

0 голосов
/ 03 февраля 2020

step1. используйте шаг ввода Microsoft Excel и сопоставьте его с файлом Excel, который содержит заголовки и точки данных. примечание: 1. убедитесь, что вы правильно выбрали тип электронной таблицы и имя листа 2. установите флажок «Заголовок» на вкладке «Содержимое» (это говорит о наличии строки заголовка в файле Excel)

step2. для объединения полей вы можете использовать калькулятор, используя тип вычисления как A + B, в котором A будет именем, а B - фамилией (вы также можете добавить константу, например, разделение запятой, в полное имя, например, имя, фамилия)

шаг 3. выберите вывод текстового файла и выберите соответствующее расширение, разделители, формат и необходимые поля, которые вам нужны в качестве вывода

, чтобы увидеть результаты

...