В настоящее время я работаю над проектом с именем ребенка.Я смотрю на самые популярные мужские и женские имена детей в каждом десятилетии, начиная с 1950-х годов.Я пытаюсь создать функцию, которая будет печатать верхнее имя для набора данных, который я ввел.
До сих пор я успешно создал два набора данных для каждого десятилетия (один мужской и другой женский)
Это код, который у меня есть для функции, но я не могу понять, как заставить ее работать ...
def getTopName(data):
(data
.drop(columns =['sex', 'prop'])
.pivot(index = 'name', columns = 'year', values = 'n')
.sum(axis=1) = data['decade']
.sort_values(by = 'decade', ascending = False))
print data[0:1]
Есть предложения о том, как этого добиться?
Мои данные выглядят так: 
В настоящее время в длинном формате.Могу ли я создать среднюю функцию, которая преобразует ее в широкую форму и создает новый столбец, в который можно суммировать итоги за каждый год (1960, 1961, ... 1969)?