Я пытаюсь получить данные из таблицы «Статистика команды» на этой веб-странице:
https://www.hockey-reference.com/teams/CGY/2010.html
У меня нет большого опыта работы с веб-копированием, но я сделал несколько попыток с пакетом XML, а теперь и с пакетом rvest:
library(rvest)
url <- html("https://www.hockey-reference.com/teams/CGY/2010.html")
url %>%
html_node(xpath = "//*[@id='team_stats']")
И в итоге получается один узел:
{xml_node}
<table class="sortable stats_table" id="team_stats" data-cols-to-freeze="1">
[1] <caption>Team Statistics Table</caption>
[2] <colgroup>\n<col>\n<col>\n<col>\n<col>\n<col>\n<col>\n<col>\ ...
[3] <thead><tr>\n<th aria-label="Team" data-stat="team_name" sco ...
[4] <tbody>\n<tr>\n<th scope="row" class="left " data-stat="team ...
Как мне разобрать это, чтобы получить заголовок и информацию в таблице из двух строк?