Как суммировать расстояния между точками данных в наборе данных с помощью GeoSpark? - PullRequest
0 голосов
/ 28 марта 2020

У меня есть таблица, подобная следующей в pyspark

+--------------------+---------+----------+
|                  ID|      lat|       lon|
+--------------------+---------+----------+
|679ac975acc4bdec9...|40.850548| -73.26763|
|679ac975acc4bdec9...| 40.85318| -73.27145|
|679ac975acc4bdec9...|40.851482| -73.26599|
|679ac975acc4bdec9...|40.853184| -73.27145|
|679ac975acc4bdec9...|40.854164| -73.26561|
|679ac975acc4bdec9...| 40.85294| -73.26544|
|679ac975acc4bdec9...|40.853584|-73.265366|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...| 40.84039|  -73.2834|
|679ac975acc4bdec9...|40.838932| -73.27933|
|679ac975acc4bdec9...|40.846146| -73.26715|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|  40.8536| -73.26254|
|679ac975acc4bdec9...|  40.8536| -73.26254|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...| 40.85319| -73.27135|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|40.855682| -73.25258|
+--------------------+---------+----------+

Я хотел бы, чтобы мы использовали функцию Geospark ST_Distance, чтобы вычислить евклидово расстояние, пройденное идентификатором пользователя. Нечто похожее на здесь , но с использованием функции geospark.

...