Я не понимаю, как обращаться с дубликатами при генерации выходных данных, поэтому я получил несколько дубликатов, но мне нужен только один.
Я пытался использовать LIMIT, но это применимо только при выборе, полагаю,Я также использовал DISTINCT, но, по-моему, неправильный сценарий.
grouped = GROUP wantedTails BY tail_number;
smmd = FOREACH grouped GENERATE wantedTails.tail_number as Tails, SUM(wantedTails.distance) AS totaldistance;
Так что для моей группы я получил смг как (не весь): ({(N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB), (N983JB),(N983JB), (N983JB)}, 44550)
, но я ожидаю (N983JB, 44550).Как я могу удалить дубликаты, сгенерированные во время группировки?Спасибо!