Я хотел бы сделать цикл с html_node для перехвата некоторых значений узлов (узлы без текста), то есть у меня есть некоторые значения
library(rvest)
country <- c("Canada", "US", "Japan", "China")
С этими значениями ("Канада", "нас ", ...), я сделал цикл, который создает URL, вставляя каждое значение с" https://en.wikipedia.org/wiki/", после этого, с каждым новым html применяет read_html (i) и последовательности кодов для окончательного перехватаузел с html_nodes ('a.page-link') - да! узел, а не текст - и сохраните этот html_nodes (...) как.character в data.frame (или может быть списком).
dff<- NULL
for ( i in country ) {
url<-paste0("https://en.wikipedia.org/wiki/",i)
page<- read_html(url)
b <- page%>%
html_nodes ('h2.flow-title') %>%
html_nodes ('a.page-link') %>%
as.character()
dff<- data.frame(b)
}
Проблема в том, что этот код сохраняет только данные из последней страны, то есть запускает первую страну и получает html_nodes (сохраняя ее), но при запуске следующей страны первые данные стираются и заменяютсяэтим новым и так далее, получив в качестве окончательного результата только данные из последней страны. Буду признателен с вашей помощью!