Как очистить сайт .aspx в R и изменить значения выпадающего списка - PullRequest
2 голосов
/ 29 марта 2019

Я хотел бы почистить таблицу по следующей ссылке: https://www.fangraphs.com/dailyprojections.aspx?pos=all&stats=bat&type=sabersim&team=0&lg=all&players=0&sort=18,d

Я могу получить результаты, используя пакет rvest, но только первые 30, которые отображаются на первой странице. Как изменить раскрывающийся список «Размер страницы» на 1000, чтобы получить все результаты?

Это код, который я пробовал до сих пор, но я предполагаю, что это не таблица HTML, поэтому нужно будет использовать другой метод.

library(rvest)
url <-  "https://www.fangraphs.com/dailyprojections.aspx?pos=all&stats=bat&type=sabersim"

url1 <- url
pgsession <- html_session(url1)
pgform <- html_form(pgsession)[[1]]
filled_form <-set_values(pgform, "DFSBoard1$dg1$ctl00$ctl02$ctl00$PageSizeComboBox" = "1000")

a <- submit_form(session = pgsession, form=filled_form)
get_table <- a %>%
html_nodes("table") %>%
.[[4]] %>%
html_table(header=TRUE)
...