Следующее из "Анализ данных с использованием панд":
Каждый ключ группировки может принимать разные формы, и ключи не обязательно должны быть
все одного типа:
• Список или массив значений такой же длины, что и ось
сгруппированных
• Дикт или серия, дающая соответствие между значениями на
сгруппируемая ось и имена групп
Я попробовал следующее:
df1
1980 1981 1982 1983 1984 1985 1986
Country
Afghanistan 16 39 39 47 71 340 496
Albania 1 0 0 0 0 0 1
Algeria 80 67 71 69 63 44 69
American Samoa 0 1 0 0 0 0 0
Andorra 0 0 0 0 0 0 2
Grouping_keys_along_axis_1
['1', '1', '1', '2', '2', '3', '3']
df1.groupby(Grouping_keys_along_axis_1, axis = 0).sum()
KeyError: '1'
Такое поведение на самом деле соответствует моему пониманию документации, но, похоже, оно не соответствует фрагменту, который я привел в начале.
Идея состояла в том, чтобы сгруппировать первые 3 столбца вместе в одну группу, следующие 2 столбца во второй группе и последние 2 столбца в третьей группе, а затем применить функцию суммирования (здесь sum ()) в каждой группе. вдоль оси = 1.
Ваш совет будет оценен.