Просмотр веб-страниц Steam с помощью R - PullRequest
0 голосов
/ 09 ноября 2019

У меня проблемы с выполнением того, что я хочу: получить все данные из обзоров Steam. В настоящее время я готовлю видеоигры, и я хотел бы провести анализ текста обзоров пользователей игр, которые стоят рядом с нами с точки зрения игрового процесса.

Для этого я использую Rvest.

2 Вопросы: -Мне удается найти способ отделить обзор от опубликованной даты. Я хотел бы иметь их в отдельных колонах. Как я мог это сделать? -Он хорошо работает, но ... у меня есть только 10 отзывов в моем data.frame, как мне получить их все? (Я потратил часы, чтобы попытаться понять, как я это делаю, но это кажется невозможным, потому что, если я правильно понял, steam использует javascript injectiion каждый раз, когда мы переходим на нижнюю часть веб-сайта, чего не делает rvest, когда ончитает ссылку.

Вот мой код:

#install.packages("rvest")
library(rvest)

link <- "https://steamcommunity.com/app/215080/reviews/"

review <- read_html(link) %>%
  html_nodes("div.apphub_CardTextContent") %>%
  html_text()

opinion <- read_html(link) %>%
  html_nodes("div.title") %>%
  html_text()

hoursplayed <- read_html(link) %>%
  html_nodes("div.hours") %>%
  html_text()

helpful <- read_html(link) %>%
  html_nodes("div.found_helpful") %>%
  html_text()

date <- read_html(link) %>%
  html_nodes("div.date_posted") %>%
  html_text()

tab <- data.frame("Posted" = date, "Review" = review, "Opinion" = opinion, "Hours Played" = hoursplayed, "Number of helpful vote" = helpful)

Заранее спасибо за вашу помощь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...