У меня проблемы с выполнением того, что я хочу: получить все данные из обзоров Steam. В настоящее время я готовлю видеоигры, и я хотел бы провести анализ текста обзоров пользователей игр, которые стоят рядом с нами с точки зрения игрового процесса.
Для этого я использую Rvest.
2 Вопросы: -Мне удается найти способ отделить обзор от опубликованной даты. Я хотел бы иметь их в отдельных колонах. Как я мог это сделать? -Он хорошо работает, но ... у меня есть только 10 отзывов в моем data.frame, как мне получить их все? (Я потратил часы, чтобы попытаться понять, как я это делаю, но это кажется невозможным, потому что, если я правильно понял, steam использует javascript injectiion каждый раз, когда мы переходим на нижнюю часть веб-сайта, чего не делает rvest, когда ончитает ссылку.
Вот мой код:
#install.packages("rvest")
library(rvest)
link <- "https://steamcommunity.com/app/215080/reviews/"
review <- read_html(link) %>%
html_nodes("div.apphub_CardTextContent") %>%
html_text()
opinion <- read_html(link) %>%
html_nodes("div.title") %>%
html_text()
hoursplayed <- read_html(link) %>%
html_nodes("div.hours") %>%
html_text()
helpful <- read_html(link) %>%
html_nodes("div.found_helpful") %>%
html_text()
date <- read_html(link) %>%
html_nodes("div.date_posted") %>%
html_text()
tab <- data.frame("Posted" = date, "Review" = review, "Opinion" = opinion, "Hours Played" = hoursplayed, "Number of helpful vote" = helpful)
Заранее спасибо за вашу помощь.