Пытается очистить таблицу от URL, но не может очистить все строки - PullRequest
0 голосов
/ 22 сентября 2018

Я пытаюсь очистить целые строки таблицы №.8 в следующем URL-адресе "https://www.screener.in/company/HCLTECH/consolidated/"

webpage<-"https://www.screener.in/company/HCLTECH/consolidated/"
Webpage<-read_html(webpage)
CF<- Webpage %>%
html_nodes("table") %>%
 .[8] %>%
html_table(fill = TRUE)

Только в состоянии получить следующие выходные данные вместо всех строк таблицы, которые свернуты на веб-странице. Как очистить свернутые строки в таблице HTML? Output table

1 Ответ

0 голосов
/ 24 сентября 2018

Я использовал RSelenium, чтобы нажать на эти плюсы, чтобы расширить таблицу.Вот моя попытка:

library(rvest)
library(Rselenium)

# initialize RSelenium
selCommand <- wdman::selenium(jvmargs = c("-Dwebdriver.chrome.verboseLogging=true"), retcommand = TRUE)
shell(selCommand, wait = FALSE, minimized = TRUE)
remDr <- remoteDriver(port = 4567L, browserName = "chrome")
Sys.sleep(5)
remDr$open()
Sys.sleep(5)

# define and navigate to url
url <-"https://www.screener.in/company/HCLTECH/consolidated/"
remDr$navigate(url)

# click the plus buttons
plus_buttons <- remDr$findElements(using = 'css selector',"#cash-flow button.show-schedules.button-link")
for (plus_button in plus_buttons) {
  plus_button$clickElement()
}

# print the table
remDr$getPageSource(header = TRUE)[[1]] %>%
  read_html() %>%
  html_node("#cash-flow .data-table") %>%
  html_table()

Однако, как указал @hrbrmstr, проверьте условия веб-страницы.Убедитесь, что вы их уважаете.В моем решении я предпочитаю печатать, а не хранить, поэтому я не копирую ничего с их сайта.

Надеюсь, это помогло!Если у вас есть какие-либо вопросы, просто дайте мне знать!

...