Как использовать xml / html древовидное представление для html документов из read_ html? - PullRequest
0 голосов
/ 02 марта 2020

Я хочу построить древовидную структуру, скажем, r-bloggers.com. Я нашел потрясающую функцию XML_tree_view, и пример отлично работает:

library(xml2)
library(htmltidy)
library(magrittr)

txt <- paste0("<note><to>Tove</to><from>Jani</from><heading>Reminder</heading>",
                             "<body>Don't forget me this weekend!</body></note>")
xml_tree_view(txt)

enter image description here

Теперь я хочу загрузить дерево XML из моей цели site:

doc <- "https://www.r-bloggers.com" %>% read_html %>% html_tree_view

, но ничего не появляется.

Что я пробовал:

xml_tree_view(doc)
html_tree_view(doc)
xml_tree_view(doc %>% toString)
html_tree_view(doc %>% toString)

Обратите внимание, я также совершенно открыт для read_hmtl альтернативы GET %>% Content.

1 Ответ

0 голосов
/ 02 марта 2020

Ваш код на самом деле работает как есть. Проблема в том, что вы сохраняете view как doc. Помните, что если вы сохраняете объект R, он автоматически не вызывает метод печати по умолчанию.

Так что все, что вам нужно сделать, это

"https://www.r-bloggers.com" %>% read_html %>% html_tree_view

, и вы должны увидеть древовидное представление.

В качестве альтернативы вы можете сделать:

doc <- "https://www.r-bloggers.com" %>% read_html %>% html_tree_view
doc

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...