Очистка веб-страницы с несколькими вкладками в R - Нет доступа к таблицам - PullRequest
0 голосов
/ 22 февраля 2020

Я просмотрел кучу вопросов о стековом потоке, касающихся подобных проблем, но я озадачен и, кажется, не могу понять, что я делаю неправильно.

Я пытался просмотреть оба источник страницы и найдите таблицу, которую я хочу, а также используйте инструмент SelectorGadget, чтобы найти элементы, которые я пытаюсь очистить, и, кажется, ничто не дает мне то, что я хочу.

Вот самый близкий я получил:

Я пытаюсь почистить наступательные и оборонительные характеристики на вкладках «Нападение» и «Защита» на этой странице (и во всех последующих играх после этой страницы):

library(tidyverse)
library(rvest)
url <- read_html("https://stats.xfl.com/1")

Просмотр html узлов Я получил этот вывод:

tbls <- html_nodes(url, "#gameStats")
tbls

{xml_nodeset (6)}
[1] <div id="gameStats" data-bind="visible: vmTeamStats.isVisible">\r\n      <div class="statDi ...
[2] <div id="gameStats" data-bind="visible: vmOffensiveStats.isVisible">\r\n\r\n      <div clas ...
[3] <div id="gameStats" data-bind="visible: vmDefensiveStats.isVisible">\r\n      <div class="s ...
[4] <div id="gameStats" data-bind="visible: vmPlayListStats.isVisible">\r\n      <div class="st ...
[5] <div id="gameStats" data-bind="visible: vmPlayListStats.isScoringVisible">\r\n      <!-- ko ...
[6] <div id="gameStats" data-bind="visible: vmPossessionStats.isVisible">\r\n      <div class=" ...

Это, кажется, приближает меня, так как теперь я вижу каждую таблицу в этом списке. Однако я не могу понять следующий шаг, например, для выбора таблиц Rushing, Passing и Receiving для соответствующих команд посетителей и хозяев.

Я пытался посмотреть, какие таблицы находятся в вкладка оскорбления, но я получаю следующую ошибку:

tbls %>% 
  .[2] %>% 
  html_table()

Error in html_table.xml_node(X[[i]], ...) : 
  html_name(x) == "table" is not TRUE

Есть мысли о том, что я делаю неправильно и как я могу заставить это работать?

...