В R я удаляю данные с веб-сайта.
После выполнения очистки я получаю объект типа xml_nodeset. Каждой из этих строк назначен тег символа href. Я хотел бы извлечь строки списка, теги href которых соответствуют определенным условиям. Есть идеи, как это сделать?
Прямо сейчас я застрял с объектом xml_nodeset, так как не знаю, как двигаться дальше.
Спасибо!
page <- read_html("elopage.html")
country_name <- page %>%
html_nodes("table") %>% html_nodes(xpath = '//*[@id="mainContent"]/div[1]/div/div/div[2]/div[2]/div/table') %>%
html_nodes("a")