У меня есть список длинных и длинных строк приблизительно 5 миллионов данных. Я попробовал код ниже, чтобы создать буфер 25 футов вокруг каждой точки и назначить новый идентификатор местоположения для всех точек, которые попадают в этот буфер. Единственная проблема здесь - производительность кода. Пожалуйста, помогите, я новичок в python и имею дело с огромным набором данных. Любая помощь в этом очень ценится!
import geopy.distance
Coord_List = Sample_Data.Lat_Long.values.tolist()
Coord_List_E = [""]*len(Coord_List)
k =1
for i in range(len(Coord_List)):
#if i==0:
#New_List[i]=k
if Coord_List_E[i]=="":
#New_List[i]=k
for j in range(i,len(Coord_List)):
if Coord_List_E[j]=="" and abs(geopy.distance.distance(Coord_List[i],Coord_List[j]).ft)<=25 :
Coord_List_E[j]=k
Coord_List_E[i]=k
#print(i,j,k)
k+=1
else:
pass
print(Coord_List_E)