Многопользовательские групповые элементы для каждой группы в опросе - PullRequest
1 голос
/ 11 апреля 2020

Я работаю над данными стека переполнения 2019 года. вот данные опроса 2019.

В этих данных много столбцов.

Я хочу выполнить этот расчет ---> "Сумма Age1stCode" / "Количество людей, которые связаны по возрасту".

Age1stCode - это столбец в опросе, иллюстрирующий первый год кодирования. Age - это столбец «age years old».

Я создал группу в соответствии с «Age».

Я просто хочу умножить каждое число противника и затем суммировать их. Например, для 11 лет = (6x3) + (7x3) + (9x2) + ....... (8x1). Я хочу сделать это для каждой возрастной группы. Итак, в конце я хочу получить результат, подобный прикрепленному мной файлу: «Возраст 11.0 ----> 326 (это, например, случайный случай), Возраст 12.0 ---> 468)

Моя цель это вычислить это ---> Сумма Age1stCode для каждой возрастной группы.

вот вывод, с которым я хочу работать. Прикрепленный файл.

1 Ответ

1 голос
/ 11 апреля 2020
df_grouped = df.groupby('Age').agg({'Age1stCode': 'sum'}).reset_index()
new_col = df_grouped['Age1stCode'] / df_grouped['Age']
...