Я хотел бы почистить таблицу по следующей ссылке: https://www.fangraphs.com/dailyprojections.aspx?pos=all&stats=bat&type=sabersim&team=0&lg=all&players=0&sort=18,d
Я могу получить результаты, используя пакет rvest, но только первые 30, которые отображаются на первой странице. Как изменить раскрывающийся список «Размер страницы» на 1000, чтобы получить все результаты?
Это код, который я пробовал до сих пор, но я предполагаю, что это не таблица HTML, поэтому нужно будет использовать другой метод.
library(rvest)
url <- "https://www.fangraphs.com/dailyprojections.aspx?pos=all&stats=bat&type=sabersim"
url1 <- url
pgsession <- html_session(url1)
pgform <- html_form(pgsession)[[1]]
filled_form <-set_values(pgform, "DFSBoard1$dg1$ctl00$ctl02$ctl00$PageSizeComboBox" = "1000")
a <- submit_form(session = pgsession, form=filled_form)
get_table <- a %>%
html_nodes("table") %>%
.[[4]] %>%
html_table(header=TRUE)