Я пытаюсь очистить архив объявлений о вакансиях в Дании с некоторыми c фильтрами на веб-сайте. Когда я пытаюсь очистить все заголовки и их ссылки, я могу получить заголовки, но не ссылки. Я пробовал разные селекторы, но ничего не поднимает ссылки. Селектор CSS ".jix_job_archived> ab, #result_list_box strong" выбирает все заголовки. Для предоставленного сайта первая ссылка должна быть: https://www.jobindex.dk/c?t=r8830962&ctx=w
Я включил изображение веб-сайта, на котором я хочу очистить "href", отмеченный в правой части экрана.
library(rvest)
library(tibble)
sel<- ".jix_job_archived > a b , #result_list_box strong"
jobindex <- "https://www.jobindex.dk/jobsoegning/kontor/offentlig?jobage=archive&maxdate=20200330&mindate=19901230"
tbl <- tibble(text = pg
%>% html_nodes(css = sel) %>%
html_text(), link = pg %>% html_nodes(css = sel) %>% html_attr('href'))
view(tbl)
**# A tibble: 20 x 2
text link
<chr> <chr>
1 Administrativ medarbejder/sekretær til stabsfunktion NA
2 Meeqqeriviup_igaffia_inuussutissanut_ikiortimik_pissarsiorpoq NA **