У меня есть следующие серии панд:
Count
Pclass Survived
1 0 80
1 136
2 0 97
1 87
3 0 372
1 119
Но я хочу что-то вроде этого:
Count Percentage
Pclass Survived
1 0 80 37.0
1 136 63.0
2 0 97 52.7
1 87 47.3
3 0 372 75.8
1 119 24.2
Я хочу рассчитать проценты, основываясь только на количестве в каждой категорииPclass (не вся сумма отсчетов).Было бы здорово, если бы эти проценты рассчитывались с использованием только столбца Count.
До сих пор я суммировал подсчеты в соответствии с Pclass и использовал .repeat () для дублирования значений и пытался объединитьэто к оригинальной серии, которая провалилась эффектно.
Count
Pclass
1 216
1 216
2 184
2 184
3 491
3 491
Моя идея состояла в том, чтобы использовать этот столбец повторения в качестве знаменателей при расчете процентов, например:
80 / 216 * 100 = 37.0%
, а затем удалить столбец повторения после вычисления процентов.Кажется так просто, но я не могу заставить его работать.Любая помощь приветствуется.