Pentaho использует вход Excel с предыдущими полями - PullRequest
0 голосов
/ 04 июня 2018

Я работаю с файлами Excel в Пентахо.

Я делаю предварительную обработку в каталогах, потому что информация хранится следующим образом:

/[year_dir]/[mounth_dir]/[store_id]_[day_ofmount].xls

' example /2017/01/4567_3.xls means  03/01/2017 sells of the store 4567

и передаю имя файла на вход Excel , но информация year,day ,store_id имя столбца добавляется в начало смещения остальных имен столбцов, но не данных Excel

Problem

1 Ответ

0 голосов
/ 05 июня 2018

Самый простой способ - включить имя файла (весь путь) в ваш поток выходных данных, а затем использовать регулярное выражение, чтобы разделить его на различные нужные вам кусочки и части, извлекая оттуда дату и сохраняя идентификатор.

Позже вы можете сделать шаг выбора значений, чтобы изменить порядок полей, если порядок важен.

...