У меня есть фрейм данных с 2 столбцами почтовых индексов, я хотел бы добавить еще один столбец с их значениями расстояния, я могу сделать это с довольно небольшим количеством строк, но теперь я работаю с фреймом данных, который имеет около 500 000 строк для расчетов. Код, который у меня есть, работает, но на моем текущем фреймворке он работал около 30 минут и все еще не был завершен, поэтому я чувствую, что то, что я делаю, крайне неэффективно.
Вот код
import pgeocode
dist = pgeocode.GeoDistance('us')
def distance_pairing(start,end):
return dist.query_postal_code(start, end)
zips['distance'] = zips.apply(lambda x: distance_pairing(x['zipstart'], x['zipend']), axis=1)
zips
Я знаю, что о циклах не может быть и речи, так что что еще я могу сделать, с точки зрения эффективности, что могло бы улучшить это?