Очистка веб-сайта с использованием rvest, который имеет 2 формы аутентификации и страницу входа - PullRequest
0 голосов
/ 26 марта 2019

Я пытаюсь отсканировать "https://hdyc.neis -one.org / " для каждого пользователя этого веб-сайта. Я должен войти в Open Street Map. Org для доступа к hdyc.neis. Он имеет 2 формы аутентификации, где я не могу создать сеанс, вошедший в систему, используя rvest

login <- "https://www.openstreetmap.org/login?cookie_test=true&referer=%2Foauth%2Fauthorize%3Foauth_callback%3Dhttps%253A%252F%252Fhdyc.neis-one.org%252Fland.html%26oauth_token%3DDfkqaWSgSDkhReTb75sOaq22QO6f6txdxFk4qJR7"
pgsession<-html_session(login)
pgform <- html_form(pgsession)[[1]]

filled_form<-set_values(pgform, username="***********", password="**********")
submit_form(pgsession, filled_form)


page<-jump_to(pgsession,"https://hdyc.neis-one.org/?SeattleImport")

data <- read_html(page)

data%>%html_text()

#data has values which is not the signed in information from hdyc.neis

Данные аналогичны тем, когда мы щелкаем правой кнопкой мыши сохранить как HTML-файл "https://hdyc.neis -one.org /? SeattleImport "

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...