Как извлечь табличные данные с веб-сайта, используя R - PullRequest
0 голосов
/ 28 января 2019

Я пытаюсь извлечь данные из веб-страницы https://www.geojit.com/other-market/world-indices и многих других, подобных этому.

Мне нужно получить табличные данные веб-сайта (INDEX, NAME, COUNTRY, CLOSE, ПРЕД. ЗАКРЫТЬ, ЧИСТЫЕ ИЗМЕНЕНИЯ, ИЗМЕНЕНИЯ (%), ПОСЛЕДНИЕ ОБНОВЛЕННЫЕ ДАТА И ВРЕМЯ).было бы здорово, если бы вы могли поделиться кодом R для этого или любая помощь будет приветствоваться.

library(rvest)
library(dplyr)   
google <- html("https://www.geojit.com/other-market/world-indices")    
google %>%    
html_nodes()

1 Ответ

0 голосов
/ 28 января 2019
library(rvest)
my_tbl <- read_html("https://www.geojit.com/other-market/world-indices") %>%    
  html_nodes(xpath = "//*[@id=\"aboutContent\"]/div[2]/table") %>%
  html_table(header = TRUE) %>%
  `[[`(1)
...