Как проверить правильность сравнения данных одного CSV-файла с другим файлом CSV с помощью Pentaho? - PullRequest
0 голосов
/ 25 апреля 2018

У меня есть два CSV-файла.В одном файле у меня есть 10 строк, а в другом списке данных.Что я хочу сделать, это проверить данные одного поля первого CSV и сравнить его с другим файлом CSV.Так как же мне этого добиться?Любая помощь будет отличной.

1 Ответ

0 голосов
/ 25 апреля 2018

Шаг, который вы ищете, называется a Stream Lookup step.

Чтение CSV и справочных файлов, сбросьте два потока в Stream Lookup и настройте его следующим образом:a) Шаг поиска = шаг, который читает ссылку. b) Ключи / поле = имя поля CSV, которое содержит любое поле, способное идентифицировать строку в файле ссылки.в) Ключи / Поле поиска = имя поля в справочном файле.г) поле для извлечения = имя поля в ссылке для возврата (может быть идентификатор или любое другое поле, которое вам нужно) д) поле для извлечения / Тип = Не забывайте!

Таким образом, вы добавите столбец из справочного файла в 10 строк CSV-файла.Затем вы можете отфильтровать строки, которые «Поиск» не обнаружил, проверив, не является ли значение нового столбца нулевым.

Как и в случае PDI, все описанные выше настройки основаны на выпадающих списках, поэтому необходимо принятьвам 2 минуты.

enter image description here

...