R - веб-очистка объектов JavaScript с V8 - PullRequest
1 голос
/ 01 апреля 2019

У меня есть некоторый опыт работы с R, но он совершенно новый для JavaScript. Недавно я пытался очистить таблицу с этого веб-сайта (http://op1.win007.com/Oddslist/1599893.htm).. Мне кажется, что веб-страница написана на JavaScript, и поэтому простой способ использования rvest для очистки не работает. Ниже способ очистить таблицу, которая мне нужна, если она находится в простом HTML:

library(rvest)
link <- "http://op1.win007.com/Oddslist/1599893.htm"
MyTable <- read_html(link) %>% html_nodes("oddsList_tab") %>% html_table(fill = TRUE)

Код выше дает мне пустой список, который я не хочу. Просматривая другие посты и учебник по V8, я обнаружил следующее:

library(rvest)
library(V8)
link <- "http://op1.win007.com/Oddslist/1599893.htm"

MyText <- read_html(link) %>% html_nodes('script') %>% html_text()

ct <- v8()
html_nodes(MyText, "oddsList_tab") %>% html_text() %>% ct$eval()

Я понятия не имею, какая часть неверна, так как я новичок в JavaScript. Кроме того, я также хотел бы получить всплывающие таблицы, которые наводят указатель мыши на цифры внутри таблиц. Видимо, я понятия не имею, как это сделать, учитывая, что мне было трудно почистить стол на поверхности.

Я читал из других постов, что может потребоваться заполнить некоторые переменные, но я понятия не имею, должен ли я это делать и как я могу это сделать.

Было бы здорово, если бы кто-то показал мне, как это сделать, и, возможно, объяснил бы мне, как это работает.

Большое спасибо.

...