У меня есть датафрейм, где каждый столбец - это временной ряд различной длины. Таким образом, отсутствуют значения как между значениями во временном ряду, так и в конце каждого временного ряда сохраняются один столбец. Я хотел бы заполнить пропущенные значения между значениями, но не заполнить "конечные" NaNs
Использование df = df.fillna(method='ffill')
дает мне большую часть пути, но заполняет концевые NaN, что мне не нужно, потому что то, где заканчиваются данные, действительно важно для моего анализа.
Edit:
Я бы хотел включить это:
ERICB SS Equity DCI US Equity FLEX US Equity
date
2008-02-14 8.026 NaN NaN
2008-02-18 NaN NaN 1.472
2008-02-19 8.074 NaN NaN
2008-02-22 NaN NaN 1.532
2008-02-25 8.062 NaN NaN
2008-03-03 8.100 NaN NaN
2008-03-06 8.100 NaN 1.955
2008-03-07 8.100 NaN NaN
2010-12-30 5.431 NaN NaN
2010-12-31 5.422 NaN NaN
2011-01-03 5.422 NaN NaN
2011-01-04 5.373 NaN NaN
В это:
ERICB SS Equity DCI US Equity FLEX US Equity
date
2008-02-14 8.026 NaN NaN
2008-02-18 8.026 NaN 1.472
2008-02-19 8.074 NaN 1.472
2008-02-22 8.074 NaN 1.532
2008-02-25 8.062 NaN 1.532
2008-03-03 8.100 NaN 1.532
2008-03-06 8.100 NaN 1.955
2008-03-07 8.100 NaN NaN
2010-12-30 5.431 NaN NaN
2010-12-31 5.422 NaN NaN
2011-01-03 5.422 NaN NaN
2011-01-04 5.373 NaN NaN
Таким образом, он заполняется вперед, но только когда в будущем будет какое-то ненулевое значение для заполнения, оставляя завершающие нули.