Когда веб-слом IMDB я получаю Spani sh результаты R - PullRequest
2 голосов
/ 01 мая 2020

Я очищаю страницу IMDB с этим кодом:

library(rvest)
url <- 'https://www.imdb.com/chart/top/'
webpage <- url %>% read_html()

title <- webpage %>% html_nodes('td.titleColumn a') %>% html_text()
title

Но я получаю результаты на испанском sh. Когда я вижу веб-страницу, список на английском языке sh. Любая помощь будет принята с благодарностью.

1 Ответ

1 голос
/ 12 мая 2020

Вы можете попробовать следующий код:

library(httr)
library(jsonlite)
library(rvest)
library(tidyverse)

headers = c(
  'User-Agent' = 'Mozilla/5.0',
  'Accept' = 'text/javascript, application/javascript, application/ecmascript, application/x-ecmascript, */*; q=0.01',
  'X-Requested-With' = 'XMLHttpRequest',
  'Accept-Language' = 'en-US,en;q=0.5'
)

r <- httr::GET(url = 'https://www.imdb.com/chart/top/', httr::add_headers(.headers=headers))
read_html(r) %>% html_nodes('td.titleColumn a') %>% html_text()

Надеюсь, этот ответ поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...