У меня есть сгруппированный набор данных, в котором столбец age содержит пропущенные значения, а столбец age связан со столбцом year. Я хотел бы заполнить эти пропущенные значения в «возрасте» на основе их отношения к «году». Набор данных выглядит следующим образом:
ID,year,age,area
654001,2013,49,East
654001,2014, ,East
654001,2015,51,East
654001,2016, ,East
112089,2000, ,West
112089,2001, ,West
112089,2002, ,West
112089,2003,42,West
Я искал в Интернете некоторые подсказки, но нашел только те, которые заполнены фиксированными значениями, либо из другого столбца, либо из другого фрейма данных, но не с заполнением динамическими значениями.
например, например, используя
df.loc()
https://stackoverflow.com/questions/57514504/fill-empty-pandas-column-based-on-condition-on-others-columns
или это использование
df.apply ()
/11142525/obnovit-znacheniya-stolbtsa-na-osnove-drugih-stolbtsov
Ожидаемый результат такой:
ID,year,age,area
654001,2013,49,East
654001,2014,50,East
654001,2015,51,East
654001,2016,52,East
112089,2000,39,West
112089,2001,40,West
112089,2002,41,West
112089,2003,42,West
Яновичок в Python, и найти это сложно, но не уверен, насколько сложна эта задача на самом деле. Кто-нибудь может предложить что-нибудь? Заранее спасибо.