Панды: Как заполнить динамическое значение в столбце на основе реляционного значения из другого столбца? - PullRequest
0 голосов
/ 17 октября 2019

У меня есть сгруппированный набор данных, в котором столбец age содержит пропущенные значения, а столбец age связан со столбцом year. Я хотел бы заполнить эти пропущенные значения в «возрасте» на основе их отношения к «году». Набор данных выглядит следующим образом:

ID,year,age,area
654001,2013,49,East
654001,2014, ,East
654001,2015,51,East
654001,2016, ,East
112089,2000, ,West
112089,2001, ,West
112089,2002, ,West
112089,2003,42,West

Я искал в Интернете некоторые подсказки, но нашел только те, которые заполнены фиксированными значениями, либо из другого столбца, либо из другого фрейма данных, но не с заполнением динамическими значениями.

например, например, используя

df.loc()
https://stackoverflow.com/questions/57514504/fill-empty-pandas-column-based-on-condition-on-others-columns

или это использование

df.apply ()
/11142525/obnovit-znacheniya-stolbtsa-na-osnove-drugih-stolbtsov

Ожидаемый результат такой:

ID,year,age,area
654001,2013,49,East
654001,2014,50,East
654001,2015,51,East
654001,2016,52,East
112089,2000,39,West
112089,2001,40,West
112089,2002,41,West
112089,2003,42,West

Яновичок в Python, и найти это сложно, но не уверен, насколько сложна эта задача на самом деле. Кто-нибудь может предложить что-нибудь? Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...