Утвердить два файла csv файлы равны, используя PIG - PullRequest
0 голосов
/ 18 июня 2020
• 1000 теперь, которое я получил из документации:
define CSVLoader org.apache.pig.piggybank.storage.CSVLoader();

data_before = LOAD 's3://samplepath_before' using CSVLoader as (c1:int, c2: int);
data_after = LOAD 's3://samplepath_after' using CSVLoader as (c1:int, c2: int);

co_group = COGROUP data_before by c1, data_after by c1;
diff_data = FOREACH co_group GENERATE DIFF(data_before, data_after);

** Как я могу утверждать, что diff_data содержит все пустые пакеты? **

...