У меня есть набор данных с этими столбцами: -
FMID,County,WIC,WICcash
Вот пример данных: -
1002267,Douglas,Y,N
21005876,Douglas,Y,N
1001666,Douglas,N,Y
Я сгруппировал данные по округам и отфильтровалданные основаны на County = 'Douglas'
.Вот вывод:
(Douglas,{(1002267,Douglas,Y,N),(21005876,Douglas,Y,N),(1001666,Douglas,N,Y)})
Теперь, если столбцы WIC
и WICcash
имеют значение как Y
, тогда я хочу взять объединенное количество значений из обоих столбцов.
Здесь, комбинируя столбцы WIC
и WICcash
, я получаю значения 3 Y
, поэтому мой вывод будет
Douglas 3
Как мне этого добиться?
Ниже приведенокод, который я написал до сих пор
load_data = LOAD 'PigPrograms/Markets/DATA_GOV_US_Farmers_Market_DataSet.csv' USING PigStorage(',') as (FMID:long,County:chararray, WIC:chararray, WICcash:chararray);
group_markets_by_county = GROUP load_data BY County;
filter_county = FILTER group_markets_by_county BY group == 'Douglas';
DUMP filter_county;