Как объединить два набора данных «данные журнала широты и долготы» и «данные сетки гексагональных ячеек» SQL или python - PullRequest
0 голосов
/ 09 мая 2020

У меня есть два набора данных, как показано ниже.

данные 1 : журнал широты / долготы

#log_id, lat, lon
0001 , 31.30272 , 103.66426
0002 , 31.23483 , 103.12323
:

данные 2 : сетка с гексагональными ячейками

#grid_id, point1_lat , point1_lon , ・・・ , point6_lat , point6_lon
000001, 31.30272 , 103.66426 , 31.30272 , 103.66426 , ・・・ , 31.30242 , 103.65676
:

Как можно Я извлекаю идентификатор сетки в данных 2, соответствующий идентификатору журнала в данных 1.

log_id , grid_id
0001 , 000324
0002 , 002341
:

Я использую PostgreSQL или python

1 Ответ

0 голосов
/ 09 мая 2020

Я думаю, вам нужно использовать внешнее слияние для объединения двух или более наборов данных в один

пример:

merged_data = pd.merge(data1, data2, how='outer)

тогда вы можете выбрать два идентификатора из объединенных данных

selected_columns = merged_data[merged_data['log_id'] & merged_data['grid_id']]
print(selected_columns)
...