Соскоб javascript веб-страницы с httr - javascript и куки должны быть включены ошибка - PullRequest
0 голосов
/ 11 апреля 2020

когда я использую следующий код r для очистки веб-страницы:

library(httr)
link = "https://racing.hkjc.com/racing/information/English/racing/LocalResults.aspx?RaceDate=2020/04/08&Racecourse=HV&RaceNo=1"
r <- GET(link)
content(r,"text")

Он создает контент с сообщениями в нем следующим образом:

-Куки должны быть включены для просмотра этого страница

- JavaScript должна быть включена для просмотра этой страницы

Я читал о фантоме js и rselenium и считаю, что мне нужен браузер без головы, чтобы загрузить html возврат веб-страницы, а затем очистить это, чтобы получить данные (это правильно?). Есть ли сейчас более простой способ извлечь эти данные? Веб-страница довольно проста c и, конечно, должен быть r-пакет, который делает все это в одном go сейчас?

Спасибо,

...