Pentaho Kettle - загрузка Excel с почти пустыми строками - PullRequest
0 голосов
/ 04 мая 2018

Я получил файл Excel из неконтролируемого источника, который содержит строку со всеми заполненными полями, а затем несколько строк, причем все поля не заполнены, кроме одного (Всегда одно и то же, это комментарий).

Комментарии принадлежат идентификатору "строки с данными".

Я хотел бы создать новое поле «КОММЕНТАРИЙ АГРЕГАТ» с объединением всех комментариев, принадлежащих идентификатору, но я не знаю, как это сделать, насколько я знаю, вы не можете взаимодействовать с порядок строк, поскольку они рассматриваются как независимые. Right Прав ли я, и это невозможно сделать внутри чайника, и следует использовать макрос VB в Excel в качестве предварительной обработки?

Спасибо за ваше время

Ответы [ 2 ]

0 голосов
/ 04 мая 2018

Вы можете использовать группирование за шагом, группировать по всем полям, кроме одного комментария, и в агрегатах выберите «объединить значения, разделенные» и использовать пробел в качестве значения для объединения (или ничего, если хотите).

Ввод Excel не может сделать все это самостоятельно.

0 голосов
/ 04 мая 2018

пока я немного продвинулся.

Я обнаружил, что на шаге ввода Excel на вкладке Поля для столбца Повтор можно установить значение Y, и если это так, он заполняет пустые строки предыдущим значением.

Все еще не знаю, как агрегировать других, но я думаю, это шаг в правильном направлении.

...