R очистить текст с помощью rvest, xml, второй страницы iframe - PullRequest
0 голосов
/ 09 мая 2018

Привет, я хочу извлечь страницу с инвестиционной целью по следующей ссылке:

http://quote.morningstar.com/etf-filing/Prospectus/2018/1/18/t.aspx?t=SPY&ft=497&d=0833554effb2f4d14d1f23a561738303

У меня есть следующий код, но проблема в том, что он очищает и дает мне первую страницу, в то время как я ищу, чтобы извлечь вторую страницу, где фактический раздел и текст

linke = 'http://quote.morningstar.com/etf-filing/Prospectus/2018/1/18/t.aspx?t=SPY&ft=497&d=0833554effb2f4d14d1f23a561738303'

read_html(linke) %>% 
html_node("iframe.sec_frame") %>% 
html_attr("src") %>% 
read_html() -> pg

text1<-html_node(pg, xpath=".//div[contains(., 'Investment Objective')]") %>% 
html_text()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...