R rvest объединяется с v8 () для очистки динамического c контента, генерируемого Javascript - PullRequest
0 голосов
/ 30 января 2020

Я могу использовать rvest для очистки прямых сайтов, но столкнулся с проблемами, когда контент динамически генерируется Javascript. Я просто хотел бы очистить заголовки https://www.geldvoorelkaar.nl/crowdfunding-projecten.

С Rvest это должно быть возможно с:

content <- read_html("https://www.geldvoorelkaar.nl/crowdfunding-projecten")
titles <- content %>% 
  html_nodes(".item-name span) %>%
  html_text()

Однако из-за Javascript названия не отображаются. Я не предпочитаю использовать RSelenium, желательно раствор с более легким весом V8 ()

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...