веб-слом: изо всех сил пытается найти правильный html_node - PullRequest
0 голосов
/ 04 марта 2019

Я пытаюсь собрать детали по ряду судебных дел и пытаюсь найти подходящий html-узел для пакета rvest.

Я использовал гаджет селектора и пробовал различные узлы, но, к сожалению, безрезультатно.Я начинаю задумываться, есть ли что-то со структурой сайта.Интересная информация, кажется, встроена во всплывающее окно, и, возможно, это мешает моим попыткам.Любая помощь?Нужно ли начинать исследование пакетов splashr, htmlunit, RSelenium?Эта ссылка ведет на один интересующий вас сайт.Меня особенно интересует информация под вкладкой «Детали дела».(У меня есть список ссылок, которые я намереваюсь сопоставить с функцией rvest).

library(rvest)
library(tidyverse)

site.case <- read_html("http://hudoc.echr.coe.int/eng?i=001-1297")

Я пробовал эти узлы, но всегда получаю пустой список в качестве ответа.

site.case %>%
    #html_node(".content")
    #html_nodes(".noticefield")
    #html_node("notice") 
    #html_node(".div.col-offset-2.noticefieldvalue")

Большое спасибо!

...