Я хочу вычеркнуть все названия смартфонов из мексиканской розничной интернет-страницы.
Я не понимаю, почему мой код не работает, потому что я сделал это для похожих веб-страниц, очевидно, RVEST не «читает» «класс» HTML-кода.
Используя гаджет Google Selector, я обнаружил, что имена смартфонов находятся в классе с именем ".name", поэтому я попробовал это:
url <- 'https://www.chedraui.com.mx/Departamentos/Tecnolog%C3%ADa/Telefon%C3%ADa/Celular/c/MC230202?siteName=Sitio+de+Chedraui&isAlcoholRestricted=false' web <- read_html(url) web %>% html_nodes('.name') %>% html_text()
Но результат: '' ''
Ожидаемый результат - вектор со всеми именами смартфонов.
Изучите ответ, и вы увидите информацию в другом классе
library(rvest) page <- read_html("https://www.chedraui.com.mx/Departamentos/Tecnolog%C3%ADa/Telefon%C3%ADa/Celular/c/MC230202?siteName=Sitio+de+Chedraui&isAlcoholRestricted=false") titles <- page %>% html_nodes('.product__list--thumb') %>% html_attr(., "title")