У меня большой набор данных с именем Плоскости с пропущенными значениями в Задержка прибытия (Arr_Delay) . Я хочу
Замените эти пропущенные значения на Среднее время задержки на Определенном маршруте (Origin - Dest) на Определенном
Carrier.
Настоящим является образец набора данных: -
date carrier Flight tailnum origin dest Distance Air_time Arr_Delay
01-01-2013 UA 1545 N14228 EWR IAH 1400 227 17
01-01-2013 UA 1714 N24211 LGA IAH 1416 227 .
01-01-2013 AA 1141 N619AA JFK MIA 1089 160 .
01-01-2013 EV 5708 N829AS LGA IAD 229 53 -18
01-01-2013 B6 79 N593JB JFK MCO 944 140 14
01-01-2013 AA 301 N3ALAA LGA ORD 733 138 .
01-01-2013 B6 49 N793JB JFK PBI 1028 149 .
01-01-2013 B6 71 N657JB JFK TPA 1005 158 19
01-01-2013 UA 194 N29129 JFK LAX 2475 345 23
01-01-2013 UA 1124 N53441 EWR SFO 2565 361 -29
код, который я пробовал: -
Proc stdize data=cs1.Planes reponly method=mean out=cs1.Complete_data;
var Arrival_delay_minutes;
Run;
Но, как говорится в моей проблеме ... я хочу получить среднее значение по конкретному маршруту и конкретному перевозчику за отсутствующее значение. Пожалуйста, помогите мне в этом!