Как я могу вычеркнуть заголовок из класса с помощью RVEST? - PullRequest
1 голос
/ 22 мая 2019

Я хочу вычеркнуть все названия смартфонов из мексиканской розничной интернет-страницы.

Я не понимаю, почему мой код не работает, потому что я сделал это для похожих веб-страниц, очевидно, RVEST не «читает» «класс» HTML-кода.

Используя гаджет Google Selector, я обнаружил, что имена смартфонов находятся в классе с именем ".name", поэтому я попробовал это:

url <- 'https://www.chedraui.com.mx/Departamentos/Tecnolog%C3%ADa/Telefon%C3%ADa/Celular/c/MC230202?siteName=Sitio+de+Chedraui&isAlcoholRestricted=false'
web <- read_html(url)

web %>%
  html_nodes('.name') %>%
  html_text()

Но результат: '' ''

Ожидаемый результат - вектор со всеми именами смартфонов.

1 Ответ

0 голосов
/ 22 мая 2019

Изучите ответ, и вы увидите информацию в другом классе

library(rvest)
page <- read_html("https://www.chedraui.com.mx/Departamentos/Tecnolog%C3%ADa/Telefon%C3%ADa/Celular/c/MC230202?siteName=Sitio+de+Chedraui&isAlcoholRestricted=false")
titles <- page %>% 
  html_nodes('.product__list--thumb') %>%
  html_attr(., "title")
...