Pandas - сумма значений столбца для данной строки с повторяющимися именами столбцов - PullRequest
0 голосов
/ 25 апреля 2020

Я бы хотел, чтобы кто-нибудь помог мне с выполнением следующей задачи, которую я пытаюсь решить. См. Ниже макет моего фрейма данных.

df= 
Date, Investor, Payment, Investor, Payment,
25/02/2018, Investor1, 100,000, Investor2, 200,000
25/04/2020, Investor1, 110,000, Investor2, 220,000

Я хотел бы получить сумму всех платежей за данную дату, т.е.

СУММА всех платежей за данную дату, где имя столбца ДФ [ 'Оплата']. Обратите внимание, что столбец Имя платежа повторяется несколько раз.

Большое спасибо за вашу помощь.

1 Ответ

3 голосов
/ 25 апреля 2020

Вы можете сделать это:

Сначала объедините дубликаты столбцов в один столбец с помощью sum():

In [556]: df                                                                                                                                                                                                
Out[556]: 
         Date    Investor   Payment    Investor  Payment
0  25/02/2018   Investor1    100000   Investor2   200000
1  25/04/2020   Investor1    110000   Investor2   220000

In [563]: df = df.groupby(df.columns, axis=1).sum() 
In [562]: df
Out[562]: 
         Date              Investor  Payment
0  25/02/2018   Investor1 Investor2   300000
1  25/04/2020   Investor1 Investor2   330000

Затем сгруппируйте по Date и найдите сумму Payment:

In [564]: df.groupby('Date')['Payment'].sum()                                                                                                                                                               
Out[564]: 
Date
25/02/2018    300000
25/04/2020    330000
Name: Payment, dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...