У меня есть данные, касающиеся жителей, разделенных по возрасту в некоторых городах. Другими словами, у меня есть что-то вроде этого
Town Aged18 Aged19 Aged20 Aged21 Aged22 Aged23 Aged24 Aged25 Total
Rome 2 3 5 10 15 25 20 18 98
Milan 15 19 21 25 25 20 35 15 175
Turin 14 8 8 10 15 25 24 6 110
Florence 10 15 15 10 25 10 5 5 95
Bologna 15 10 25 10 15 10 25 20 130
Я хочу создать новый столбец, в котором указано, в каком столбце «возраст» медиана распределения жителей приходится на каждый город. Другими словами, я хочу создать что-то вроде этого
Town Aged18 Aged19 Aged20 Aged21 Aged22 Aged23 Aged24 Aged25 Total Median
Rome 2 3 5 10 15 25 20 18 98 23
Milan 15 19 21 25 25 20 35 15 175 22
Turin 14 8 8 10 15 25 24 6 110 22,5
Florence 10 15 15 10 25 10 5 5 95 21
Bologna 15 10 25 10 15 10 25 20 130 22
Строго говоря, я хочу создать цикл, который суммирует содержимое каждого столбца до тех пор, пока мы не достигнем средней позиции, которая, если сумма столбцов нечетная, соответствует (n + 1) / 2, тогда как, если она четная, это соответствует (n / 2 + (n + 1) / 2) / 2. Последний случай относится к Турину в моем кадре данных, где я в среднем составляю от 22 до 23, поскольку они соответствуют столбцам, в которых содержатся соответственно 55-е (110/2) и 56-е (111/2) наблюдения.
Поэтому я хочу, чтобы новый столбец не вычислял медиану по значениям столбцов (что мы можем сделать через rowMedian), но я хочу, чтобы он возвращал столбец (столбцы), который содержит медианное наблюдение.
Может кто-нибудь помочь мне с этим ?? Большое спасибо, я надеюсь, что это может быть полезно даже для кого-то, кто пытается сделать что-то подобное.