Пакет rvest не распознает форму - PullRequest
0 голосов
/ 12 февраля 2019

Я хотел удалить некоторые данные со следующего веб-сайта: http://predstecajnenagodbe.fina.hr/pn-public-web/predmet/search, но когда я попытался использовать rvest:

library(rvest)
session <- html_session("http://predstecajnenagodbe.fina.hr/pn-public-web/predmet/search")
form <- html_form(session)
form

, он не находит форму, даже если она там есть (как вы можете видеть на странице).

Я также пытался использовать функцию POST из пакета httr:

parameters <- list(since = "1.6.2018", until = "5.6.2018", `g-recaptcha-response` = "03AF6jDqXcBw1qmbrxWqadGqh9k8eHAzB9iPbYdnwzhEVSgCwO0Mi6DQDgckigpeMH1ikV70egOC0UppZsO7tO9hgdpEIaI04jTpG6JxGMR6wov27kEkLuVsEp1LhxZB4WFDRkDWdqcZeVN1YkiojUpje4k-swFG7tPyG2pJN86SdT290D9_0fyfrxlpfFNL2VUwE_c15vVthcBEdXIQ68V5qv7ZVooLiwrdTO2qLDLF1yUZWiu9IJoLuBWdFzJ_zdSP6fbuj5wTpfPdsYJ2n988Gcb3q2aYdn-2TVuWoQzqs1wbh7ya_Geo7_8gnDUL92l2nqTeV9CMY58fzppPPYDJcchdHFTTxadGwCGZyKC3WUSh81qiGZ5JhNDUpPnOO-MgSr5aPbA7tei7bbypHV9OOVjPGLLtqA9g")

httr::POST(
  url,
  body = parameters, 
  config = list(
    add_headers(Referer = "http://predstecajnenagodbe.fina.hr"),
    user_agent(get_header()),
    accept_encoding = get_encoding(),
    use_proxy("xxxx", port = 80,
              username = "xxx", password = "xxxx"),
    timeout(20L),
    tcp_keepalive = FALSE
  ),
  encode = "form",
  verbose()
)

, но он возвращает некоторый код JS и сообщение:

Пожалуйста, включите JavaScript для просмотра содержимого страницы. Ваш ID поддержки: 10544975822212666004

Не могли бы вы объяснить, почему rvest не распознает форму и почему POST не работает, eater

...