Очистка URL-адресов с веб-страницы с помощью rvest in R - PullRequest
0 голосов
/ 23 ноября 2018

Я тихий новичок в R и программировании в целом.Я пытаюсь очистить URL-адреса с веб-страницы, используя rvest in R. На веб-странице перечислены рекламные объявления, и я выяснил, как очистить все заголовки, но мне нужны URL-адреса из рекламных объявлений.Прочитав некоторые вопросы, которые я обнаружил, я, вероятно, должен использовать html_attr("href"), но это дает мне ошибку.Мой текущий код выглядит следующим образом:

url <- "https://www.marktplaats.nl/z/watersport-en-boten/surfen-kitesurfen.html?categoryId=1404&attributes=S%2C31&attributes=S%2C32&attributes=S%2C8360&attributes=S%2C8361&startDateFrom=always"
webpage <- read_html(url)
data_html <- html_nodes(webpage,'.mp-listing-title')
data <- html_text(data_html)

Может кто-нибудь сказать мне, как получить URL-адреса?Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...