Очистка веб-данных для использования в R-Studio - PullRequest
0 голосов
/ 10 сентября 2018

Я хочу вытащить данные с этого серверного сайта в R-Studio. Я новичок в R, так что совсем не уверен, что это возможно. Любая помощь с кодированием для достижения этой цели будет принята.

http://hbrcdata.hbrc.govt.nz/hydrotel/cgi-bin/hydwebserver.cgi/points/details?point=679&samples=true

1 Ответ

0 голосов
/ 10 сентября 2018
install.packages("rvest")
library('rvest')
install.packages('XML')
library('XML')
library("httr")


#Specifying the url for desired website to be scrapped
url <- 'http://hbrcdata.hbrc.govt.nz/hydrotel/cgi- 
        bin/hydwebserver.cgi/points/samples?point=679'





webpage <- read_html(url)

tbls <- html_nodes(webpage, "table")

head(tbls)


tbls_ls <- webpage %>%
           html_nodes("table") %>%
           html_table(fill = TRUE)

tbl <- as.data.frame(tbls_ls)

View(tbl)

Я попытался получить несколько других таблиц с данного веб-сайта, который работает нормально.

например:

глубина осадков:

http://hbrcdata.hbrc.govt.nz/hydrotel/cgi-bin/hydwebserver.cgi/points/details?point=63

Небольшая модификация в URL, как показано ниже, приведет вас к фактической таблице. остальные кодовые реамины одинаковы ( детали? точка = 63 как сэмплы? точка = 63 )

url <- 'http://hbrcdata.hbrc.govt.nz/hydrotel/cgi-bin/HydWebServer.cgi/points/samples?point=63'

для получения дополнительной помощи вы можете обратиться на сайт: http://bradleyboehmke.github.io/2015/12/scraping-html-tables.html

...