R ReadHTMLTable Pro Футбол Референс Командное Правонарушение - PullRequest
0 голосов
/ 17 декабря 2018

Я пытаюсь перевести таблицу «Team Offense» в R. Я пробовал несколько приемов и не могу заставить их работать.Похоже, R только читает первые две таблицы.Ссылка ниже.

https://www.pro -football-reference.com / years / 2018 / index.htm

Это то, что я пробовал ...

   library(XML)
TeamData = 'https://www.pro-football-reference.com/years/2018/index.htm'TeamData = 'https://www.pro-football-reference.com/years/2018/index.htm'
URL = TeamData
URLdata = getURL(URL)
table = readHTMLTable(URLdata, stringsAsFactors=F, which = 5)

1 Ответ

0 голосов
/ 17 декабря 2018

Scraping Sports Справочные сайты могут быть хитрыми, но они являются отличными источниками:

library(rvest)
library(httr)

link <- "https://www.pro-football-reference.com/years/2018/index.htm"

doc <- GET(link)

cont <- content(doc, "text") %>% 
  gsub(pattern = "<!--\n", "", ., fixed = TRUE) %>% 
  read_html %>% 
  html_nodes(".table_outer_container table") %>% 
  html_table()

# Team Offense table is the fifth one
df <- cont[[5]]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...