Для первого сайта данные скребутся в reservoirs data.frame, который просто нуждается в уборке, но для второго есть два набора таблиц, верхний и нижний, и я не знаю, как получить ниже.
reservoirs
data.frame
сайтов:
1) http://cdec.water.ca.gov/reportapp/javareports?name=RES
2) http://cdec.water.ca.gov/reportapp/javareports?name=FNF
library(tidyverse) library(XML) reservoirs <- "http://cdec.water.ca.gov/reportapp/javareports?name=RES" %>% readHTMLTable() %>% data.frame() flows_part1 <- "http://cdec.water.ca.gov/reportapp/javareports?name=FNF" %>% readHTMLTable() %>% data.frame() #flows_part2 <- ??
Любые идеи о том, как получить вторую таблицу со второго сайта (или лучший способ получить все изначально?)
Спасибо!
Функция readHTMLTable сохраняет все таблицы в виде списка, который затем можно извлечь из каждого элемента списка.
flows <- readHTMLTable("http://cdec.water.ca.gov/reportapp/javareports?name=FNF", as.data.frame = TRUE) flows_part1 <- flows[[1]] flows_part2 <- flows[[2]]