Извлечение геопространственных данных из Википедии с помощью Web-Scraping - PullRequest
0 голосов
/ 09 июля 2019

Я перебираю данные о координатах для некоторых мест с помощью Википедии. Я следую инструкциям, изложенным здесь : (обратите внимание, что я изменил пример на гиперссылке, чтобы соответствовать моей работе)

library(plyr)
library(dplyr)
library(xml2)
library(rvest)
library(magrittr)
library(geosphere)
location<-"Mendizorrotza"
#read HTML code from the website
  webpage<-read_html(paste0("https://en.wikipedia.org/wiki/",location))
  table <- webpage %>%
    html_nodes("table.vcard") %>%
    html_table(header=F)
  table <- table[[1]]

  #add the table to a dataframe
  dict <- as.data.frame(table)

В строке координат, это дает мне три варианта:

42 ° 50′13,60 ″ с.ш. 2 ° 41′16,96 ″ ш;

42,8371111 ° N, 2,6880444 ° W;

42,8371111; -2,6880444

все в одной строке. Я хотел бы найти расстояние между парой координат. Следовательно, какой из них я должен использовать для этого и как его извлечь? Также я никогда раньше не работал с координатами, какое уравнение я должен использовать, чтобы найти желаемое значение?

...