Мне было интересно, какой самый эффективный метод вычисления расстояния в милях между двумя столбцами почтового индекса США будет использовать R.
Я слышал о пакете геосферы для вычисления разницы между почтовыми индексами, но не до конца понимаю его, и мне было интересно, есть ли альтернативные методы.
Например, скажем, у меня есть фрейм данных, который выглядит следующим образом.
ZIP_START ZIP_END
95051 98053
94534 94128
60193 60666
94591 73344
94128 94128
94015 73344
94553 94128
10994 7105
95008 94128
Я хочу создать новый фрейм данных, который выглядит следующим образом.
ZIP_START ZIP_END MILES_DIFFERENCE
95051 98053 x
94534 94128 x
60193 60666 x
94591 73344 x
94128 94128 x
94015 73344 x
94553 94128 x
10994 7105 x
95008 94128 x
Где x - это разница в милях между двумя почтовыми индексами.
Каков наилучший метод расчета этого расстояния?
Вот код R для создания примера фрейма данных.
df <- data.frame("ZIP_START" = c(95051, 94534, 60193, 94591, 94128, 94015, 94553, 10994, 95008), "ZIP_END" = c(98053, 94128, 60666, 73344, 94128, 73344, 94128, 7105, 94128))
Пожалуйста, дайте мне знать, если у вас есть какие-либо вопросы.
Любой совет приветствуется.
Спасибо за вашу помощь.