Как я могу извлечь выборочные данные с веб-страницы, используя rvest? - PullRequest
1 голос
/ 09 марта 2020

Я пытался отобразить рейтинг обзора этой песни, используя rvest in r из Вилы https://pitchfork.com/reviews/albums/us-girls-heavy-light/. В данном случае это 8,5. Но так или иначе я получаю это: enter image description here

Вот мой код

library(rvest)
library(dplyr)
library(RCurl)
library(tidyverse)

URL="https://pitchfork.com/reviews/albums/us-girls-heavy-light/"

webpage = read_html(URL)


cat("Review Rating")
webpage%>%
   html_nodes("div span")%>%
   html_text

1 Ответ

5 голосов
/ 09 марта 2020

Мы можем получить соответствующую информацию из класса div, который равен "score-circle".

library(rvest)

webpage %>% html_nodes('div.score-circle') %>% html_text() %>% as.numeric()
#[1] 8.5
...