Я храню огромный файл .csv во фрейме данных pandas.Структура таблицы примерно такая:
Category Time Col1
1 00:00 3
1 01:00 6
1 01:00 10
2 02:00 8
2 02:00 12
2 03:00 6
3 04:00 13
3 05:00 8
Я хочу найти следующее для каждой категории
[суммирование (сумма col1 для каждого времени каждой категории) * (количествоcol1 для каждого времени в каждой категории)] / (общее количество строк) для каждой категории.
Так что в основном я пытаюсь применить группу один раз для категории, а затем в каждой категории, я хочу применить группуснова по времени и вычислите, как указано выше.
Так что для приведенного выше примера мой вывод должен выглядеть как
Category Col1
1 [3 + (2 * (6 + 10))] / 8
2 [(2 * (8 + 12)) + 6] / 8
3 [13 + 8] / 8