R: html_table возвращает заголовки таблицы, но без содержимого таблицы - PullRequest
0 голосов
/ 03 апреля 2019

Я пытаюсь использовать R для сканирования таблиц рейтинга университетов с https://www.timeshighereducation.com/world-university-rankings/2019/world-ranking#!/page/0/length/100/sort_by/rank/sort_order/asc/cols/stats. Мне удалось получить только заголовки таблиц, но мне действительно нужны все данные.

library(rvest)
library(tidyverse)
url<- read_html("https://www.timeshighereducation.com/world-university-rankings/2019/world-ranking#!/page/0")

html_nodes(url, "#datatable-1") %>% html_table()

Результаты

> html_nodes(url, "#datatable-1") %>% html_table()
[[1]]
 [1] rank order                Rank                      Name                      Node ID                   Overall                  
 [6]                           Teaching                                            Research                                           
[11] Citations                                           Industry Income                                     International Outlook    
[16]                                                                                                                                  
[21]                                                     No. of FTE Students       No. of students per staff International Students   
[26] Female:Male Ratio        
<0 rows> (or 0-length row.names)

Результатами, которые я хочу получить, будут все данные из таблицы, захваченной в кадре данных, а не только временные заголовки. Есть идеи, что случилось?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...