Представьте, что у меня есть фрейм данных, который выглядит следующим образом:
ID DATE VALUE_1 Value_2 ...
1 31-01-2006 5 "USD"
1 31-01-2007 5 "USD"
1 31-01-2008 10 "USD"
1 31-01-2011 11 "USD"
2 31-12-2006 5 "USD"
2 31-12-2007 5 "USD"
2 31-12-2008 5 "USD"
2 31-12-2009 5 "USD"
С дополнительными столбцами X.
Как вы можете видеть, это данные панели с несколькими записями в одну и ту же дату для разных идентификаторов,Что я хочу сделать, это заполнить пропущенные даты для каждого идентификатора.Вы можете видеть, что для идентификатора «1» существует скачок в месяцах между второй и третьей записью.
Мне бы хотелось, чтобы датафрейм выглядел так, как показано ниже - имейте в виду, что я ищу решение, которое работает для фреймов данных со многими столбцами значений +30 и многими идентификаторами (1000+), и при этом остается эффективным,Т.е. не должно быть никакого заполнения данных для идентификаторов, которые уже «завершены», что означает, что они уже имеют частоту, указанную в данных.В этом случае годовая частота.Имейте в виду, однако, что, хотя они имеют годовую частоту, они не всегда следуют календарному году.
ID DATE VALUE_1 Value_2 ...
1 31-01-2006 5 "USD"
1 31-01-2007 5 "USD"
1 31-01-2008 10 "USD"
1 31-01-2009 NA NA
1 31-01-2010 NA NA
1 31-01-2011 11 "USD"
2 31-12-2006 5 "USD"
2 31-12-2007 5 "USD"
2 31-12-2008 5 "USD"
2 31-12-2009 5 "USD"