Я использую это руководство в качестве примера для очистки времени публикации сообщений в Reddit.
В нем говорится об использовании инструмента SelectorGadget для обхода изучения других языков, вот чтоЯ сделал.
Хотя на странице old.reddit.com показано 100 сообщений (поэтому необходимо записать 100 раз), из моего кода фактически извлечено только 25 разных значений времени.Вот как выглядит мой код:
library(rvest)
url <- 'https://old.reddit.com/'
rawdata <- read_html(url)
rawtime <- html_nodes(rawdata, '.live-timestamp')
#".live-timestamp" was obtained using the Chrome extension "SelectorGadget"
finalresult <- bind_rows(lapply(xml_attrs(rawtime), function(x) data.frame(as.list(x), stringsAsFactors=FALSE)))