Добавление базового URL в векторные компоненты - PullRequest
0 голосов
/ 29 марта 2020

Я пытаюсь извлечь некоторую информацию из форума tesla, но темы появляются без базового URL https://forums.tesla.com. Можете ли вы посоветовать, как добавить это? спасибо

url <- "https://forums.tesla.com/forum/tesla-model-3"

h <- read_html(url)

threads <- h %>%
  html_nodes("#content-body .odd a") %>% html_text()

thread_links <- h %>%
  html_nodes("#content-body .odd a") %>% html_attr(name = "href")

thread_links
 [1] "/forum/forums/please-read-first-posting-forums"                                                       
 [2] "/forum/forums/battery-died-while-vacation"                                                            
 [3] "/forum/forums/tesla-and-motionsickness"                                                               
 [4] "/forum/forums/having-remove-phone-pocket"           

1 Ответ

0 голосов
/ 29 марта 2020

Это конкатенация строк, поэтому используйте paste0 (или paste(..., sep=""):

library(magrittr)
library(rvest)

threads <- h %>%
  html_nodes("#content-body .odd a") %>% html_text()

thread_links <- h %>%
  html_nodes("#content-body .odd a") %>% 
  html_attr(name = "href") %>%
  paste("https://forums.tesla.com", .)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...