Впервые пытаюсь собрать некоторые финансовые данные с веб-сайта Morningstar.
В частности, я пытаюсь собрать данные о свободном денежном потоке на акцию для следующей компании: Hongkong Land Holdings
Я использовал селекторный гаджет, чтобы выделить нужные данные.На следующем снимке экрана показано, что я сделал.
Я попытался использовать следующий скрипт R для получения данных о свободном денежном потоке на акцию.Однако список, возвращаемый функцией html_nodes
, представляет собой список 0. Я пытался использовать css из гаджета выбора, а также xpath.Оба метода не дали желаемого результата.
library(rvest)
url <- "http://financials.morningstar.com/ratios/r.html?t=H78"
webpage <- read_html(url)
FCF_per_share <- html_nodes(webpage, css = "#i90 , tr:nth-child(28) td, :nth-child(7) :nth-child(11) :nth-child(6) :nth-child(5) :nth-child(3) td:nth-child(4)")
FCF_per_share <- html_nodes(webpage, xpath = "//*[(@id = "i90")] | //tr[(((count(preceding-sibling::*) + 1) = 28) and parent::*)]//td//*[(((count(preceding-sibling::*) + 1) = 7) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 11) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 6) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 5) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 3) and parent::*)]//td[(((count(preceding-sibling::*) + 1) = 4) and parent::*)]")
Я попытался посмотреть на переменную моей веб-страницы выше.Это список из 2. Когда я пытался использовать квадратные скобки в переменной веб-страницы, мне выдаются следующие результаты (я не уверен, что это означает и правильно ли это):
webpage[[1]]
<pointer: 0x07928060>
webpage[[2]]
<pointer: 0x0778adc8>
Помогите многимоценили.Спасибо!