У меня есть 1 столбец данных с серией URL в единственном столбце (может быть вектором точно так же).В этом примере мы сохраним каждый URL-адрес одинаковым:
urls<-as.data.frame(c("https://en.wikipedia.org/wiki/List_of_counties_in_California", "https://en.wikipedia.org/wiki/List_of_counties_in_California","https://en.wikipedia.org/wiki/List_of_counties_in_California"))
colnames(urls)<-"col1"
urls$col1<-as.character(urls$col1)
У меня также есть написанная функция, которая очищает таблицу от этих URL-адресов:
wiki_scrape <- function(x){
x_url <- x %>%
read_html() %>%
html_nodes(xpath='//*[@id="mw-content-text"]/div/table[2]') %>%
html_table() %>%
.[[1]] %>%
select(County)
return(x_url)
}
Результат wiki_scrape(urls[1,1])
представляет собой фрейм данных 58 наблюдений.Я хотел бы запустить эту функцию wiki_scrape
итерационным образом по всему вектору urls
(а не только urls[1,1]
) и добавить каждый результирующий кадр данных к предыдущему результирующему кадру данных.В этом примере в urls
указаны 3 URL-адреса, поэтому я хочу, чтобы мой результирующий фрейм данных имел длину 174 наблюдения (3 * 58 = 174, где 58 - длина одного фрейма данных, обработанного с использованием wiki_scrape
).