Примечание : после прочтения моего вопроса, если вы считаете, что я не использовал правильные теги, предложите изменить.
Я работаю с набором данных, который имеет координаты обоих предложенных маршрутов.и фактический путь выбран.Датафрейм выглядит примерно так:
waypoint lon lat sug_lon sug_lat lon_diff lat_diff tripe_id
0 s 52.516204 13.378365 52.516204 13.378365 0.0 0.00 1
1 a 52.516279 13.379535 52.516279 13.379535 0.0 0.00 1
2 b 52.516365 13.380854 52.516365 13.380854 0.0 0.00 1
3 c 52.516644 13.380736 52.516644 13.380736 0.0 0.00 1
4 d 52.516934 13.380661 52.516934 13.380661 0.0 0.00 1
5 e 52.518082 13.380457 52.518082 13.380457 0.0 0.00 1
6 f 52.518650 13.380361 52.518650 13.380361 0.0 0.00 1
7 g 52.518929 13.380296 52.518929 13.380296 0.0 0.00 1
8 h 52.519004 13.381165 52.519004 13.381165 0.0 0.00 1
9 i 52.519047 13.381455 52.519047 13.381455 0.0 0.00 2
10 j 52.519187 13.382088 52.519187 13.392088 0.0 -0.01 2
11 k 52.519820 13.384298 52.519820 13.394298 0.0 -0.01 2
12 l 52.519927 13.384652 52.519927 13.394652 0.0 -0.01 2
13 m 52.520120 13.385167 52.520120 13.395167 0.0 -0.01 2
14 n 52.520238 13.385425 52.520238 13.385425 0.0 0.00 2
15 o 52.520664 13.386115 52.520664 13.386115 0.0 0.00 2
Но я не могу понять, как определить, отклонился ли человек от первоначального пути.Один из подходов, который я использовал, как видно из столбцов lat_diff
& lon_diff
, заключается просто в разнице между двумя
df['lat_diff']=df['lat']-df['sug_lat']
, и если его нет 0
, то это означает, что транспортное средство отклоняется отОригинальный путь.
Но это выглядит не очень сложно и эффективно, учитывая размер исходного набора данных.Кто-нибудь может предложить что-нибудь еще или моей логики достаточно, чтобы пройти.