R Web Scraping Использование цикла по нескольким узлам CSS Многостраничный запрос - PullRequest
0 голосов
/ 09 января 2019

Я пытаюсь очистить, используя несколько запросов полей с одной и той же веб-страницы, используя список различных поисковых запросов (в данном случае символы биржевых символов). У меня есть нужные CSS-поля со страницы для очистки и список тикеров, но я не видел, как создать цикл for для этого. Создание правильного вывода по одному запросу работает следующим образом:

CEF_Page <- read_html("https://www.cefconnect.com/fund/QQQX") 
call1 <- CEF_Page %>%
        html_nodes("#basics > div > div.span6.well.well-small > 
        div") %>% 
        html_text() %>% 
        strsplit(split = "\n") %>%
        unlist() %>%
        .[. != ""]

call1 <- str_replace_all(call1,pattern = "\t", replacement = "") 
call1 <- str_replace_all(call1,pattern = "\r", replacement = "")
call2 <- call1[call1 != ""] 
as.data.frame(call2) 

Это нужные CSS-селекторы: "#overview, #basics> div> div.span6.well.well-small> div, # basics> div> div: nth-child (1)"

В идеале, индекс должен быть создан путем присвоения соответствующего тикера полю / строке, очищенной в цикле for. Спасибо!

...