очистить все таблицы с одной веб-страницы? - PullRequest
0 голосов
/ 28 июня 2019

Для первого сайта данные скребутся в reservoirs data.frame, который просто нуждается в уборке, но для второго есть два набора таблиц, верхний и нижний, и я не знаю, как получить ниже.

сайтов:

1) http://cdec.water.ca.gov/reportapp/javareports?name=RES

2) http://cdec.water.ca.gov/reportapp/javareports?name=FNF

library(tidyverse)
library(XML)

reservoirs <-  "http://cdec.water.ca.gov/reportapp/javareports?name=RES" %>% 
               readHTMLTable() %>% 
               data.frame()  

flows_part1 <- "http://cdec.water.ca.gov/reportapp/javareports?name=FNF" %>% 
               readHTMLTable() %>% 
               data.frame()


#flows_part2 <- ??  

Любые идеи о том, как получить вторую таблицу со второго сайта (или лучший способ получить все изначально?)

Спасибо!

1 Ответ

1 голос
/ 28 июня 2019

Функция readHTMLTable сохраняет все таблицы в виде списка, который затем можно извлечь из каждого элемента списка.

flows <-  readHTMLTable("http://cdec.water.ca.gov/reportapp/javareports?name=FNF", as.data.frame = TRUE)

flows_part1 <- flows[[1]]
flows_part2 <- flows[[2]]
...