Невозможно очистить финансовые данные от Morningstar с помощью rvest и Selector Gadget - PullRequest
0 голосов
/ 26 июня 2018

Впервые пытаюсь собрать некоторые финансовые данные с веб-сайта Morningstar.

В частности, я пытаюсь собрать данные о свободном денежном потоке на акцию для следующей компании: Hongkong Land Holdings

Я использовал селекторный гаджет, чтобы выделить нужные данные.На следующем снимке экрана показано, что я сделал.

Hongkong Land Selector Gadget

Я попытался использовать следующий скрипт R для получения данных о свободном денежном потоке на акцию.Однако список, возвращаемый функцией html_nodes, представляет собой список 0. Я пытался использовать css из гаджета выбора, а также xpath.Оба метода не дали желаемого результата.

library(rvest)

url <- "http://financials.morningstar.com/ratios/r.html?t=H78"

webpage <- read_html(url)

FCF_per_share <- html_nodes(webpage, css = "#i90 , tr:nth-child(28) td, :nth-child(7) :nth-child(11) :nth-child(6) :nth-child(5) :nth-child(3) td:nth-child(4)")

FCF_per_share <- html_nodes(webpage, xpath = "//*[(@id = "i90")] | //tr[(((count(preceding-sibling::*) + 1) = 28) and parent::*)]//td//*[(((count(preceding-sibling::*) + 1) = 7) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 11) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 6) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 5) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 3) and parent::*)]//td[(((count(preceding-sibling::*) + 1) = 4) and parent::*)]")

Я попытался посмотреть на переменную моей веб-страницы выше.Это список из 2. Когда я пытался использовать квадратные скобки в переменной веб-страницы, мне выдаются следующие результаты (я не уверен, что это означает и правильно ли это):

webpage[[1]]
<pointer: 0x07928060>
webpage[[2]]
<pointer: 0x0778adc8>

Помогите многимоценили.Спасибо!

...