У меня есть такие данные
name, id, nametype,recclass,mass, fall, year,
Aachen,1, Valid, L5, 21, Fell, 01/01/1880 12:00:00 AM,
Aarhus,2, Valid, H6, 720 Fell, 01/01/1951 12:00:00 AM
: :
: :
: 45700
Мне нужно узнать нет. записей за десятилетний период с использованием пиглатина. не знаю начальный и конечный год, так как данные не отсортированы
Я попробовал следующий код:
nasadata = load 'Meteorite_Landings.csv' using PigStorage(',') as(name:chararray,id:int,nametype:chararray,recclass:chararray,mass:int,fall:chararray,year:chararray);
B = FOREACH nasadata GENERATE year;
C = FOREACH B GENERATE ToDate(year,'dd-MM-YYYY') as year1;
когда я сбросил C, это показывает, что не удалось прочитать данные из входного файла. но это работал, когда я сбросил nasadata.when я описываю C он показывает
C: {year1: datetime}
grunt>