У меня есть таблица, подобная следующей в pyspark
+--------------------+---------+----------+
| ID| lat| lon|
+--------------------+---------+----------+
|679ac975acc4bdec9...|40.850548| -73.26763|
|679ac975acc4bdec9...| 40.85318| -73.27145|
|679ac975acc4bdec9...|40.851482| -73.26599|
|679ac975acc4bdec9...|40.853184| -73.27145|
|679ac975acc4bdec9...|40.854164| -73.26561|
|679ac975acc4bdec9...| 40.85294| -73.26544|
|679ac975acc4bdec9...|40.853584|-73.265366|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...| 40.84039| -73.2834|
|679ac975acc4bdec9...|40.838932| -73.27933|
|679ac975acc4bdec9...|40.846146| -73.26715|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...| 40.8536| -73.26254|
|679ac975acc4bdec9...| 40.8536| -73.26254|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...| 40.85319| -73.27135|
|679ac975acc4bdec9...|40.855682| -73.25258|
|679ac975acc4bdec9...|40.855682| -73.25258|
+--------------------+---------+----------+
Я хотел бы, чтобы мы использовали функцию Geospark ST_Distance
, чтобы вычислить евклидово расстояние, пройденное идентификатором пользователя. Нечто похожее на здесь , но с использованием функции geospark
.