Я пытаюсь отсканировать 2 вещи с этой веб-страницы:
url <- https://www.iproperty.com.sg/property/district-03/queens-peak/sale-14141722/
1) Строка объектов
a <- read_html(url) %>%
html_nodes('div.feature-description-content.ListingFeatureDescription__FeatureDescriptionContent-dFVvWS.hPahWk') %>%
html_text()
Но это дает мне
{xml_nodeset (0)}
2) И URL (https://www.iproperty.com.sg/property-agent/leen-ho-30613/) с этого узла:
a <- read_html(url) %>% html_nodes('h2.ContactFormstyle__FormTitle-bxPrOO.iFCeFd') %>% html_attr('href')
Также пробовал
a <- read_html(url) %>% html_nodes('h2.ContactFormstyle__FormTitle-bxPrOO.iFCeFd a') %>% html_attr('href')
Оба дали мне набор узлов размером 0.
Благодарим Вас за помощь. (Есть ли какой-нибудь веб-сайт / видео, в котором подробно описаны html_nodes, html_text и html_attr, например, как извлечь элементы и другие типы элементов, которые я, возможно, не знаю?)
Также похоже на Q1:
h2.contact-name.agent
div.contact-license
div.brand-name.BrandColorstyle__BrandNameWrapper-hXMAim.dAVmwh