Объединение Широты и Долготы из отдельных столбцов в Dataframe, а затем использование haversine для расстояния - PullRequest
0 голосов
/ 12 января 2020

Я занимаюсь проблемой такси в Нью-Йорке из Kaggle для практики. Точки захвата и высадки такси представлены в виде четырех столбцов в кадре данных: pickup_latitude, pickup_longitude, dropoff_latitude, dropoff_longitude. Я хочу сделать пикап длинным и длинным в одно и то же для выпадения, так что я могу использовать их в функции haversine для вычисления расстояния. У меня проблемы со всей этой частью.

Я хочу, чтобы она была в формате (lat, long) с запятой между ними, чтобы я мог использовать ее непосредственно с haversine

1 Ответ

0 голосов
/ 12 января 2020

Примерно так:

df["long_lat"] = list(zip(df["pickup_longitude"], df["pickup_latitude"]))

Также вы можете использовать geo pandas:

from shapely.geometry import Point
from geopandas import GeoDataFrame

geometry = [Point(xy) for xy in zip(df["pickup_longitude"], df["pickup_latitude"])]
crs = {'init': 'epsg:4326'}
geo_df = GeoDataFrame(df, crs=crs, geometry=geometry)
...