rvest не может сканировать текст и html после использования элемента проверки для проверки - PullRequest
0 голосов
/ 22 февраля 2020

Я пытаюсь отсканировать 2 вещи с этой веб-страницы:

url <- https://www.iproperty.com.sg/property/district-03/queens-peak/sale-14141722/

1) Строка объектов

a <- read_html(url) %>% 
      html_nodes('div.feature-description-content.ListingFeatureDescription__FeatureDescriptionContent-dFVvWS.hPahWk') %>% 
      html_text()

Но это дает мне

{xml_nodeset (0)}

2) И URL (https://www.iproperty.com.sg/property-agent/leen-ho-30613/) с этого узла:

a <- read_html(url) %>% html_nodes('h2.ContactFormstyle__FormTitle-bxPrOO.iFCeFd') %>% html_attr('href')

Также пробовал
a <- read_html(url) %>% html_nodes('h2.ContactFormstyle__FormTitle-bxPrOO.iFCeFd a') %>% html_attr('href')

Оба дали мне набор узлов размером 0.

Благодарим Вас за помощь. (Есть ли какой-нибудь веб-сайт / видео, в котором подробно описаны html_nodes, html_text и html_attr, например, как извлечь элементы и другие типы элементов, которые я, возможно, не знаю?)

Также похоже на Q1:

h2.contact-name.agent
div.contact-license
div.brand-name.BrandColorstyle__BrandNameWrapper-hXMAim.dAVmwh
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...