Удаление выбросов перед использованием groupby (). Agg (). Reset_index () - PullRequest
0 голосов
/ 27 сентября 2019

У меня есть база больших данных из sqlite, превращенная в следующий фрейм данных.

dfObj:
ID     routeID    acnr     x       y
1      6          4        100,1   99,7
2      6          4        100,2   99,9
3      6          4        99,4    100,4 
4      6          3        60,7    60,7
5      6          2        87,9    88,6
6      6          4        120,2   100,5
7      6          6        30,4    35,9
8      6          1        96,0    94,5
9      6          2        85,3    93,6
10     6          6        35,7    38,3
11     6          4        99,9    98,9
12     6          3        62,1    62,1
13     6          4        100,0   100,5
14     6          4        99,6    100,6
15     6          4        101,1   99,3

После использования следующего кода и переименования имен столбцов:

df_route_action_freq = dfObj.groupby(['acnr']).agg({'routeId': 'size', 'x':'mean', 'y':'mean'}).reset_index()

я получаю следующий фрейм данных:

acnr     freq     mean_x   mean_y
1        1        96,0     94,5
2        2        86,6     91,1
3        2        61,4     61,4
4        8        102,6   100,0
6        2        33,1    37,1

, как вы можете видеть, является строкой 6 выбросом acnr 4. Каждое значение x составляет около 100 при acnr = 4, а строка 6 говорит, что x = 120.

Знаете ли вы путь между dfOBj и df_route_action_freq для удаления обводов?

Большое спасибо.

...