Я новичок в написании скриптов для свиней, и я столкнулся со странной проблемой в операторе UNION в PIG.
Допустим, у меня есть файл my_file с точно одним значением, как показано ниже
COVID19
Теперь я загружаю его в переменную с именем A
B=FOREACH A GENERATE $0,'B';
DUMP B;
Я ВИЖУ СЛЕДУЮЩИЙ ВЫВОД
COVID19 B
Точно так же, допустим, у меня есть следующий код
C=FOREACH A GENERATE $0,'C';
DUMP C;
D=FOREACH A GENERATE $0,'D';
DUMP D;
E=FOREACH A GENERATE $0,'D';
DUMP E;
Весь приведенный выше код работает нормально.
Проблема возникает, когда я хочу их ОБЪЕДИНЯТЬ, как показано ниже
X =UNION B,C;
DUMP X;
I SEE ONLY THE OUTPUT OF B
И когда я это делаю,
Y =UNION B,C,D;
DUMP Y;
I See the Output of B and C combined
И когда Да,
Z =UNION B,C,D,E;
DUMP Y;
I See the Output of only E
Это супер странно, Может ли кто-нибудь объяснить, как работает Union, Можно ли на самом деле иметь более 2/3 объединения таблиц в 1 заявлении, поскольку X = union a, b, c, d; или нет.