Очистка значений от скрытых входных тегов разбитой на страницы таблицы с использованием RSelenium и rvest - PullRequest
0 голосов
/ 03 февраля 2019

Я застрял, пытаясь очистить список URL-адресов из разбитой на страницы таблицы, используя R. Таблица не видна заранее и появляется только после нажатия кнопки.Не похоже, что его содержимое также видно.У меня нет опыта работы с JavaScript, и я не уверен, как работают разбитые на страницы таблицыТаким образом, надеясь, что некоторые эксперты могут помочь.

То, что я пытаюсь извлечь, это «значение» за элементами таблицы.Есть ли способ сделать это с помощью RSelenium?

Вот страница, которую я пытаюсь очистить, и снимок того места, где я застрял -

Веб-страница: https://www.stoxx.com/index-details?symbol=SXXP#

Снимок:https://ibb.co/RhCSTr0

Мне не повезло, потянув за теги a или td.Мне удалось только перейти к разделу «Компоненты» с помощью экземпляра clickElement ().

Вот что у меня пока есть -

#Loading the rvest and RSelenium packages
library(rvest)
library(RSelenium)

#start RSelenium
rD <- rsDriver(port = 4445L)
remDr <- rD$client

url <- 'https://www.stoxx.com/index-details?symbol=SXXP#'

remDr$navigate(url)

#Click the components button to view table
webElem <- remDr$findElement(using = "link text", "Components")
webElem$clickElement()
...