рассчитать проценты после объединения 2 таблиц - PullRequest
0 голосов
/ 10 ноября 2018

У меня есть две таблицы, и я хотел бы видеть общее количество клиентов и общее количество мужчин и женщин в каждой книге. Найдя это, Я бы хотел получить процент от пола клиента.

Here is the Customer table:

Cus_Id  Fname       Gender
12      Sam         male
13      Waqas       female
14      Sim         male
15      Rwan        female

Here is the Books_cust table: 

Book_Id     Cus_Id      Rating
348         12          5
342         13          8   
323         13          4
434         15          9


I have so far is the following code.

LOAD1 = load '/user/Customer.txt' using PigStorage() AS (Cus_Id:int, Fname:chararray, Gender:chararray);
LOAD2 = load '/user/Books_cust.txt' using PigStorage() AS (Book_Id:int,Cus_Id:int, Rating:int);
JOIN1 = JOIN LOAD1 BY Cus_Id, LOAD2 by Cus_Id;
GROUP1 = GROUP JOIN1 BY (Book_Id, Gender);
GENERATE1 = FOREACH GROUP1 GENERATE FLATTEN(group), COUNT(JOIN1);
...