Я хотел бы собрать информацию с веб-страницы.Есть экран входа в систему, и когда я вошел в систему, я могу получить доступ ко всем видам страниц, с которых я хотел бы почистить информацию (например, фамилия игрока, объект .lastName
).Я использую R и пакеты rvest
и httr
.
Почему-то, похоже, вход в систему работает, но я не знаю, как быть перенаправленным на страницу, с которой мне нужно получить информацию.
Форма входа в систему доступна на http://kickbase.sky.de/anmelden
, а соответствующие страницы имеют форму http://kickbase.sky.de/spielerprofil/player-name/number
, например http://kickbase.sky.de/spielerprofil/nadiem-amiri/1639#
.
Вот код, который я использовал.Большое спасибо за вашу помощь.
install.packages("rvest")
install.packages("httr")
library(rvest)
library(httr)
handle <- handle("http://kickbase.sky.de") # Create handle
path <- "anmelden" # Login Path
# fields found in the login form.
login <- list(
email = "testscrape@gmail.com"
,password = "tester"
,redirect_url = # I want to be redirected to this page and then scrape info from here
"http://kickbase.sky.de/spielerprofil/nadiem-amiri/1639#"
)
response <- POST(handle = handle, path = path, body = login)
webpage <- read_html(response)
name_data <- html_text(html_nodes(webpage, ".lastName"))
name_data