У меня есть датафрейм с 8 столбцами и ~ 0,8 млн строк. Я хочу найти режим каждых 50 строк определенного столбца (например, столбца 5) в отдельном кадре данных. Мой подход выглядит следующим образом.
for i in range(1, len(data['Column5'])-1) :
splitdata = (data['Column5'][i:(i+49)])
mode_pressure[j] = splitdata.mode()
i = i+50
j = j+1
Но я получаю сообщение об ошибке «объект int не поддерживает назначение элемента». Мой DF выглядит следующим образом
Col1 Col2 Col3 Col4 Col5 Col6 Col7 Col8
0 612458 6715209 671598606 101043 -56 224 16560
1 612458 6715210 671598706 101038 -264 256 16696
2 612458 6715211 671598806 101038 -144 192 16528
3 612458 6715212 671598906 101043 -136 200 16576
4 612458 6715213 671599006 101037 -232 104 16576
5 612458 6715214 671599106 101038 -88 264 16904
6 612458 6715215 671599206 101040 -200 176 16808
7 612458 6715212 671598906 101043 -136 200 16576
8 612458 6715213 671599006 101037 -232 104 16576
9 612458 6715214 671599106 101040 -88 264 16904
10 612458 6715215 671599206 101040 -200 176 16808
Output: (assume mode of 5 values)
df_mode : 101038, 101048
Я написал ту же функцию в R. И R возвращает последнее (последнее) значение режима в качестве одного выхода для каждого набора 50.
i=1
j=1
while(i<=length(data$Column5)-1) {
splitdata<-data$Column5[i:(i+49)]
mode_value[j] = modeest::mfv(splitdata)
i=i+50
j=j+1
}