Я бы хотел скопировать гиперссылки на этой веб-странице в кадр данных со столбцами, показанными ниже. Исходная страница содержит заголовки и списки ссылок.
- subject.heading (проблема)
- hyperlink.title (OK)
- гиперссылка (ОК)
Получение ссылок и названий просто (html_node
"li" и "a"). Я не понимаю, как включить предметные заголовки в окончательный фрейм данных.
library(tidyverse)
library(rvest)
my.url <- read_html("http://www.secnav.navy.mil/fmc/fmb/Pages/Fiscal-Year-2019.aspx") %>%
html_nodes("#sharePointMainContent")
hyperlink.title <- my.url %>%
html_nodes("li") %>%
html_text()
hyperlink <- my.url %>%
html_nodes("li") %>%
html_nodes("a") %>%
html_attr("href")
df <- tibble(title, hyperlink.title)
Я могу успешно очистить заголовки, но не могу понять, как правильно включить их в окончательный кадр данных.
subject.heading <- my.url %>%
html_nodes("h3") %>%
html_text() %>% str_trim()
Создано в 2018-09-03 пакетом представ (v0.2.0).