У меня есть две таблицы, и я хотел бы видеть общее количество клиентов и общее количество мужчин и женщин в каждой книге. Найдя это, Я бы хотел получить процент от пола клиента.
Here is the Customer table:
Cus_Id Fname Gender
12 Sam male
13 Waqas female
14 Sim male
15 Rwan female
Here is the Books_cust table:
Book_Id Cus_Id Rating
348 12 5
342 13 8
323 13 4
434 15 9
I have so far is the following code.
LOAD1 = load '/user/Customer.txt' using PigStorage() AS (Cus_Id:int, Fname:chararray, Gender:chararray);
LOAD2 = load '/user/Books_cust.txt' using PigStorage() AS (Book_Id:int,Cus_Id:int, Rating:int);
JOIN1 = JOIN LOAD1 BY Cus_Id, LOAD2 by Cus_Id;
GROUP1 = GROUP JOIN1 BY (Book_Id, Gender);
GENERATE1 = FOREACH GROUP1 GENERATE FLATTEN(group), COUNT(JOIN1);