У меня есть два df
с,
df_1
txn creator code y_m count
WP BATCH 16 201908 17
WP BATCH 16 201909 32
FB ID2 06 201905 65
FB ID2 13 201906 77
BA TO 08 201904 99
BA TO 08 201905 76
df_2
txn user code y_m count
WP BATCH 16 201908 10
WP BATCH 16 201909 13
FB ID2 06 201905 23
FB ID2 13 201906 34
HF HUD 01 201904 9
HF HUD 01 201903 8
Я хочу внутреннее соединение df_1
и df_2
,
df_1.merge(df_2, how='inner', left_on=['txn', 'creator', 'code', 'y_m'], right_on=['txn', 'user', 'code', 'y_m'])
и агрегат (сумма) count
для df_1
и df_2
, в то время как конкретные строки для двух информационных фреймов также сохраняются в результате df
;
df
txn creator code y_m count user
WP BATCH 16 201908 27 BATCH
WP BATCH 16 201909 45 BATCH
FB ID2 06 201905 88 ID2
FB ID2 13 201906 111 ID2
BA TO 08 201904 99 NaN
BA TO 08 201905 76 NaN
HF NaN 01 201904 9 HUD
HF NaN 01 201903 8 HUD