Web Scraping tableauViz в R-фрейм данных - PullRequest
0 голосов
/ 07 сентября 2018

Я потратил много времени в поисках ответа на этот вопрос, но пока ничего не нашел. То, что я пытаюсь сделать, это очистить информацию таблицы Tableau, которая содержится в элементе tableauViz, и распространить ее в R-фрейм данных. В моей первой попытке, используя RStudio, я использовал следующий код и попытался прочитать tableauViz как HTML

# Load rvest functions
library(rvest)
# Specifying the url for desired website to be scrapped
url <- “https://oir.uga.edu/factbook/studentinformation/S07StuP58/”
# Reading the HTML code from the website                                          
webpage <- read_html(url)  
# Using CSS selectors to scrap the rankings section                                                     
rank_data_html <- html_nodes(webpage,'.tableauViz')

Вывод был отформатирован в виде списка xml_nodeset следующим образом.

[[1]]
[[1]][[1]]
[1] "\n                                    "

[[1]]$param
list()
attr(,"name")
[1] "host_url"
attr(,"value")
[1] "https%3A%2F%2Fpublic.tableau.com%2F"

[[1]]$param
list()
attr(,"name")
[1] "site_root"
attr(,"value")
[1] ""

[[1]]$param
list()
attr(,"name")
[1] "name"
attr(,"value")
[1] "S07StuP58/Dashboard1"

[[1]]$param
list()
attr(,"name")
[1] "tabs"
attr(,"value")
[1] "no"

[[1]]$param
list()
attr(,"name")
[1] "toolbar"
attr(,"value")
[1] "yes"

[[1]]$param
list()
attr(,"name")
[1] "static_image"
attr(,"value")
[1] "https://public.tableau.com/static/images/S0/S07StuP58/Dashboard1/1.png"

[[1]]$param
list()
attr(,"name")
[1] "animate_transition"
attr(,"value")
[1] "yes"

[[1]]$param
list()
attr(,"name")
[1] "display_static_image"
attr(,"value")
[1] "yes"

[[1]]$param
list()
attr(,"name")
[1] "display_spinner"
attr(,"value")
[1] "yes"

[[1]]$param
list()
attr(,"name")
[1] "display_overlay"
attr(,"value")
[1] "yes"

[[1]]$param
list()
attr(,"name")
[1] "display_count"
attr(,"value")
[1] "yes"

[[1]]$param
list()
attr(,"name")
[1] "filter"
attr(,"value")
[1] "publish=yes"

attr(,".class")
[1] "tableauViz"
attr(,"style")
[1] "display:none;"

Единственным атрибутом из этого списка, который я нашел в качестве значения, была ссылка png на статическое изображение.

Tableau Static png

Однако я не верю, что смогу преобразовать что-либо из этого в массив данных.

Единственной ссылкой на эту проблему было превосходное видео на YouTube «Интеграция Tableau с ноутбуками от R до R и Shiny». Я перешел на сайт автора GitHub , чтобы посмотреть, смогу ли я найти пример кода, но не смог его найти.

Если кто-либо имеет опыт работы с этой проблемой или может направить меня к какому-либо примеру кода, я был бы очень признателен

Спасибо.

...