Допустим, у меня есть следующий фрейм данных:
df = pd.DataFrame({"unique_id": [1, 1, 1], "att1_amr": [11, 11, 11], "att2_nominal": [1, np.nan, np.nan], "att3_nominal": [np.nan, 1, np.nan], "att4_bok": [33.33, 33.33, 33.33], "att5_nominal": [np.nan, np.nan, np.nan], "att6_zpq": [22.22, 22.22, 22.22]})
То, что я хочу сделать, это сгруппировать по строкам фрейма данных unique_id
, чтобы я мог применить отдельную операцию группировки к столбцам, содержащим слово nominal
, и отдельную для всех остальных , Чтобы быть более точным, я хочу сгруппировать по столбцам, которые содержат nominal
, используя sum(min_count = 1)
, а другие - first()
или last()
. Результат должен быть следующим:
df_result = pd.DataFrame({"unique_id": [1], "att1_amr": [11], "att2_nominal": [1], "att3_nominal": [1], "att4_bok": [33.33], "att5_nominal": [np.nan], "att6_zpq": [22.22]})
Спасибо!