Выскабливание текстов с веб-страницы - PullRequest
0 голосов
/ 13 марта 2020

Я пытался почистить тексты с этого сайта , но я не могу сделать это правильно.

Я пытался искать и пробовать разные способы, но я просто могу Кажется, вы не поцарапали раздел отзывов как тексты внизу страницы. Может кто-нибудь сказать мне, что не так с моим кодом?

Вот мой код:

newurl <- "https://www.sephora.com/product/virgin-marula-tm-luxury-facial-oil-P392245?icid2=products%20grid:p392245"
newurl <- read_html(newurl)
text <- newurl %>% html_nodes(".css-7rv8g1")
text <- html_text(text)

Я использовал селектор CSS, чтобы получить узлы для раздела обзора, который был . css -7rv8g1, а затем я выбрал этот узел, чтобы получить текст со следующим кодом, но он возвращает мне пустую строку.

Может кто-нибудь сказать мне, что я здесь не так сделал?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...