Я хочу почистить базу данных «Peoples Daily», китайской газеты. Один из способов получить доступ к архиву с 47 года - сегодня - это DFN (Deutsches Forschungsnetzwerk) и действующий аккаунт на crossasia.org.
1. Первым делом выберите ваше учреждение по номеру https://login.erf.sbb.spk-berlin.de/hanshibboleth/login, которое перенаправит вас на веб-страницу DFN с формулой для выбора вашего учреждения.
Выберите Crossasia.org (VHO)
Это перенаправит вас на страницу входа в систему crossasia.org
Теперь моя проблема заключается в следующем: я думаю, что достигну первый шаг с пакетом rvest
, выполняющим следующий код
require("rvest")
session <- html_session("https://login.erf.sbb.spk-berlin.de/hanshibboleth/login")
form <- html_form(session)[[1]]
form <- set_values(form,
user_idp = "CrossAsia.org (VHO)")
Если вы повторите первый шаг в вашем браузере, веб-страница перенаправит вас сразу на CrossAsia.org, к сожалению, кажется, что это не работает в R Итак, вот мой вопрос:
Как я могу перейти на страницу входа или получить URL-адрес страницы входа? Поскольку страница входа в систему, похоже, также имеет токен c, указанный в сеансе, скопировать и вставить ссылку страницы входа в систему из браузера нельзя.