Рассчитать расстояние на основе длины широты, поля groupby 2 в python - PullRequest
0 голосов
/ 27 июня 2018

У меня есть набор данных для моей системы слежения за автотранспортными средствами, который требует от меня расчета расстояния по широте и долготе. Поймите, что с помощью формулы haversine можно получить расстояние между строками, но я застрял, потому что мне нужно расстояние на основе поля 2 (тип модели и режим).

Как показано ниже, мой код:

def haversine(lat1,lon1,lat2,lon2, to_radians = True, earth_radius =6371):
    if to_radians:
        lat1,lon1,lat2,lon2 = np.radians([lat1,lon1,lat2,lon2])

    a = np.sin((lat2-lat1)/2.0)**2+ np.cos(lat1) * np.cos(lat2) * np.sin((lon2-lon1)/2.0)**2

    return earth_radius *2 * np.arcsin(np.sqrt(a))

mydataset = pd.read_csv(x + '.txt')
print (mydataset.shape)
mydataset = mydataset.sort_values(by=['Model','timestamp']) #sort
mydataset['dist'] = 
np.concatenate(mydataset.groupby(["Model"]).apply(lambda 
         x: haversine(x['Latitude'],x['Longitude'],
         x['Latitude'].shift(),x['Longitude'].shift())).values)

С этим я могу рассчитать расстояние на основе модели (используя сортировку) между строками.

Но я хотел бы сделать еще один шаг, чтобы рассчитать на основе как режима, так и модели. Мои поля: «Индекс, модель, режим, широта, долгота, отметка времени»

Пожалуйста, совет!

Index, Model, Timestamp, Long, Lat, Mode(denote as 0 or 2), Distance Calculated
1, X, 2018-01-18 09:16:37.070, 103.87772815, 1.35653496, 0, 0.0
2, X, 2018-01-18 09:16:39.071, 103.87772815, 1.35653496, 0, 0.0
3, X, 2018-01-18 09:16:41.071, 103.87772815, 1.35653496, 0, 0.0
4, X, 2018-01-18-09:16:43.071, 103.87772052, 1.35653496, 0, 0.0008481795
5, X, 2018-01-18 09:16:45.071, 103.87770526, 1.35653329, 0, 0.0017064925312804799
6, X, 2018-01-18 09:16:51.070, 103.87770526, 1.35653329, 2, 0.0
7, X, 2018-01-18 09:16:53.071, 103.87770526, 1.35653329, 2, 0.0
8, X, 2018-01-18 09:59:55.072, 103.87770526, 1.35652828, 0, 0.0005570865824842293

Мне нужно, чтобы рассчитать расстояние полного пути модели, а также расстояние полного пути модели в любом режиме

1 Ответ

0 голосов
/ 27 июня 2018

Я думаю, что нужно добавить DataFrame contructor для работы, а затем добавить еще одно имя столбца к groupby, как ["Model", "Mode(denote as 0 or 2)"] или ["Model", "Mode"] по именам столбцов:

def haversine(lat1,lon1,lat2,lon2, to_radians = True, earth_radius =6371):
    if to_radians:
        lat1,lon1,lat2,lon2 = np.radians([lat1,lon1,lat2,lon2])

    a = np.sin((lat2-lat1)/2.0)**2+ np.cos(lat1) * np.cos(lat2) * np.sin((lon2- 
    lon1)/2.0)**2

    return pd.DataFrame(earth_radius *2 * np.arcsin(np.sqrt(a)))


mydataset['dist'] = (mydataset.groupby(["Model", "Mode(denote as 0 or 2)"])
                              .apply(lambda x: haversine(x['Lat'],
                                                         x['Long'], 
                                                         x['Lat'].shift(),
                                                         x['Long'].shift())).values)

#if need replace NaNs to 0  
mydataset['dist'] = mydataset['dist'].fillna(0)

print (mydataset)
   Index Model               Timestamp        Long       Lat  \
0      1     X 2018-01-18 09:16:37.070  103.877728  1.356535   
1      2     X 2018-01-18 09:16:39.071  103.877728  1.356535   
2      3     X 2018-01-18 09:16:41.071  103.877728  1.356535   
3      4     X 2018-01-18 09:16:43.071  103.877721  1.356535   
4      5     X 2018-01-18 09:16:45.071  103.877705  1.356533   
5      6     X 2018-01-18 09:16:51.070  103.877705  1.356533   
6      7     X 2018-01-18 09:16:53.071  103.877705  1.356533   
7      8     X 2018-01-18 09:59:55.072  103.877705  1.356528   

   Mode(denote as 0 or 2)  Distance Calculated      dist  
0                       0             0.000000  0.000000  
1                       0             0.000000  0.000000  
2                       0             0.000000  0.000000  
3                       0             0.000848  0.000848  
4                       0             0.001706  0.001706  
5                       2             0.000000  0.000557  
6                       2             0.000000  0.000000  
7                       0             0.000557  0.000000  
...