У меня есть файл Excel
import pandas as pd
df = pd.read_excel('file.xlsx')
У меня 40 столбцов. Однако меня не интересуют все колонки. Я хочу конкретно сгруппировать 18 из них и суммировать 20 из них. Примечание. Все столбцы, которые я хочу сгруппировать, отличаются от столбцов, которые я хочу суммировать.
Таким образом, я создал следующий список для столбцов, которые я хочу group by
, каждый элемент является именем (заголовок) ) столбца.
Col_to_Group = ['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T']
И Col_to_Sum
- столбцы, которые я хочу суммировать.
Col_to_Sum= ['AA','BB','CC','DD','EE','FF','GG','HH','II','JJ','KK','LL','MM','NN','OO','PP','QQ','RR','SS','TT']
Затем я применяю функции group by
и sum
к моему фрейм данных
result = df.groupby(Col_to_Group)[Col_to_Sum].sum()
И я получаю ошибку:
"groupby() takes from 1 to 8 positional arguments."