KNIME, сравнивающий наборы данных - PullRequest
0 голосов
/ 07 мая 2019

Можете ли вы ответить: - Так как мы используем KNIME для запуска нашего согласно нашему требованию. В наших рабочих процессах мы сравниваем данные о клиентах в 2 базах данных, одном оракуле и одном Hive, а затем хотим получить отчет о том, сколько данных сопоставлено, а какое нет. поэтому теперь мы хотим сгруппировать некоторые идентификаторы клиентов в зависимости от местоположения клиентов, чтобы увидеть, из какого местоположения мы получаем больше несоответствий. Можете ли вы сказать мне, что все узлы я должен использовать, чтобы получить этот тип настраиваемого отчета

1 Ответ

1 голос
/ 07 мая 2019

Не очень понятно, как вы хотите провести сравнение, но я думаю, вам понадобится узел Joiner . После этого вы можете использовать узел GroupBy для использования узла GroupBy для вычисления несоответствий по местоположению, но перед этим вы должны использовать, например, узел Rule Engine для преобразования созданных пропущенных значений. Joiner до значения (если исходные наборы данных имеют пропущенные значения в интересных столбцах, их следует изменить до Joiner ), а все остальные значения - на другое значение.

...