В частности, у меня есть временной ряд заболеваний, проходящих через популяцию лошадей. Я хочу создать частоту, основанную не на времени, а на случаях, чтобы df поддерживал свой текущий порядок, но перечислял 1000 случаев для каждой записи. Если запись слишком высокая, она создаст новую строку, а если слишком низкую, она объединится со следующей строкой, усредняя входные данные на основе составных номеров случаев, чтобы я мог получить гетероскедастичность из данных. Я понимаю, что мог бы сделать это с помощью массивного цикла, но мне интересно, есть ли какие-либо менее сложные в вычислительном отношении методы применения, которые я могу использовать для выполнения той же задачи. Таким образом, в приведенном ниже примере время 0 создаст четыре новые строки, последняя из которых, имеющая 699 записей, слится с 230 из времени 1 плюс 71 из времени 2, усредняя их серьезность и состояния по количеству входных случаев.
Time Severity Cases States
0 4 3699 39
1 7 230 15
2 2 1300 27
3 3 740 13
4 2 3000 23