Оператор Союза в скрипте свиньи - PullRequest
0 голосов
/ 11 июля 2020

Я новичок в написании скриптов для свиней, и я столкнулся со странной проблемой в операторе UNION в PIG.

Допустим, у меня есть файл my_file с точно одним значением, как показано ниже

COVID19

Теперь я загружаю его в переменную с именем A

B=FOREACH A GENERATE $0,'B';
DUMP B;

Я ВИЖУ СЛЕДУЮЩИЙ ВЫВОД

COVID19 B

Точно так же, допустим, у меня есть следующий код

C=FOREACH A GENERATE $0,'C';
DUMP C;
D=FOREACH A GENERATE $0,'D';
DUMP D;
E=FOREACH A GENERATE $0,'D';
DUMP E;

Весь приведенный выше код работает нормально.

Проблема возникает, когда я хочу их ОБЪЕДИНЯТЬ, как показано ниже

X =UNION B,C;
DUMP X;

I SEE ONLY THE OUTPUT OF B

И когда я это делаю,

Y =UNION B,C,D;
DUMP Y;

I See the Output of B and C combined

И когда Да,

Z =UNION B,C,D,E;
DUMP Y;

I See the Output of only E

Это супер странно, Может ли кто-нибудь объяснить, как работает Union, Можно ли на самом деле иметь более 2/3 объединения таблиц в 1 заявлении, поскольку X = union a, b, c, d; или нет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...