Я пытаюсь найти строки в очень большом фрейме данных с самым высоким средним значением.
Причина: я сканировал что-то с помощью лазерных трекеров и использовал «более высокую» точку в качестве точки начала сканирования.Я пытаюсь найти размещенный объект по моим данным.
Я вычислил среднее значение каждой строки с помощью:
base = df.mean(axis=1)
base.columns = ['index','Mean']
Вот пример среднего значения для каждой строки:
0 4.407498
1 4.463597
2 4.611886
3 4.710751
4 4.742491
5 4.580945
Кажется, это работает нормально, за исключением того, что он добавляет столбец индекса и выдает столбцы с индексом типа float64.Затем я попытался найти строки с самым высоким средним значением:
moy = base.loc[base.reset_index().groupby(['index'])['Mean'].idxmax()]
Это выдает tis:
index Mean
0 0 4.407498
1 1 4.463597
2 2 4.611886
3 3 4.710751
4 4 4.742491
5 5 4.580945
Но это только переиндексирование (у меня теперь 3 столбца вместо двух) и больше ничего не делает.Он по-прежнему показывает все строки.