Я работаю с набором данных, из которого подмножество имеет начальные и конечные значения.Я создал id
, который позволяет мне идентифицировать эти наблюдения, поэтому после применения этого:
df['aux']=df.duplicated(subset=['id'], keep=False)
df_dup=df_dup[df_dup.aux==True]
df_dup.sort_values(by='id').reset_index(inplace=True)
я получаю что-то вроде этого:
index id status value
88 1 'initial' 8
95 1 'final' 12
63 2 'initial' 9
52 2 'final' 13
Что я хочу достичь, это заменитьпоследнее значение в начальном значении:
index id status value
88 1 'initial' 12
95 1 'final' 12
63 2 'initial' 13
52 2 'final' 13
Я пробовал несколько вещей, моя последняя попытка была такой:
df_dup[df_dup.status=='initial'].reset_index().value= \
df_dup[df_dup.status=='final'].reset_index().value
Но это заполняет initial
значения nan
:
index id status value
88 1 'initial' nan
95 1 'final' 12
63 2 'initial' nan
52 2 'final' 13
Чего мне не хватает?Спасибо