Вы можете использовать преобразование объединения для объединения наборов результатов из обоих файлов. Это даст вам следующий набор результатов.
col1, col2, col3
-----------------
1,2,3
4,5,6
1,2,3
После этого я использую преобразователь агрегатора и выбираю эти порты (и те, которые вы хотите сгруппировать, чтобы они считались дублирующимися) и получал счет в преобразователе агрегатора.
After Aggregator (new column count => total_count)
----------------------------------------------------
col1, col2, col3,total_count
-----------------------------
1,2,3,2
4,5,6,1
Следующий шаг прост: пропустите их через преобразование фильтра и используйте следующее условие фильтра, чтобы игнорировать строки, имеющие дубликаты.
total_count = 1