Я использую Python Pandas. У меня есть 2 фрейма данных (а именно: df1, df2). «df1» содержит данные уровня заголовка, такие как идентификатор карты, дата выдачи и т. д. «df2» содержит данные уровня детализации, как и каждая транзакция, выполняемая конкретным идентификатором карты. «Идентификатор карты» является общим для двух фреймов данных.
df1:
first_active_month card_id feature_1 feature_2 feature_3
2017-06 C_ID_92a2005557 5 2 1
2017-01 C_ID_3d0044924f 4 1 0
2016-08 C_ID_d639edf6cd 2 2 0
2017-09 C_ID_186d6a6901 4 3 0
2017-11 C_ID_cdbd2c0db2 1 3 0
df2:
junk_id authorized_flag card_id city_id Authorized
13292136 Y C_ID_92a2005557 101 N
20069042 Y C_ID_7a238b3713 69 N
5029656 Y C_ID_92a2005557 17 N
16356907 N C_ID_3d0044924f -1 Y
8203441 Y C_ID_fcf33361c2 17 N
Я хочу добавить столбец «частота» в df1, который будет показывать мне количество вхождений каждого идентификатора карты в df1 в df2. Итак, df1 должен выглядеть следующим образом:
df1 (after executing the command):
first_active_month card_id feature_1 feature_2 feature_3 frequency
2017-06 C_ID_92a2005557 5 2 1 2
2017-01 C_ID_3d0044924f 4 1 0 5
2016-08 C_ID_d639edf6cd 2 2 0 3
2017-09 C_ID_186d6a6901 4 3 0 1
2017-11 C_ID_cdbd2c0db2 1 3 0 7
Обратите внимание: я новичок в Python / Pandas. Я уже просмотрел несколько потоков этого сайта, но все они ссылались на подсчет в одном кадре данных. Я ищу подсчет с использованием функции объединения / слияния. Темы, которые я уже просмотрел: это , это , это , это , это , это , это .