Чтение содержимого iframe в R - PullRequest
0 голосов
/ 13 июля 2020

Я пытаюсь сканировать веб-сайт, и у меня проблемы с чтением текста внутри iframe.

Я искал несколько простых способов, используя значение sr c (например, Как можно Я читаю и анализирую содержимое iframe в R ), но проблема в том, что мой код html просто адресует значение sr c как неизвестное.

<iframe name="ViewDetail" title="ABCD" src="" frameborder="0" scrolling="auto" width="100%" height="100%" marginwidth="0" marginheight="0"></iframe>
#DOCUMENT
<html xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:fo="http://www.w3.org/1999/XSL/Format" xmlns:fn="http://www.w3.org/2005/xpath-functions"><head>
.....

Я мог бы найти узел iframe, но не смог добраться до текста, вписанного внутри. (или фактический sr c URL)

iframe = html %>% html_nodes("iframe") %>% extract(3); iframe %>% html_nodes(css = ".para")

Код взят из результатов поиска на корейском сайте суда (https://search.ccourt.go.kr/ths/pr/selectThsPr0101List.do), и я вручную нашел URL-адрес документа html с надписью iframe, но я не знаю, как адресовать его с помощью кода. Буду признателен за любую помощь, включая любые ссылки, коды на других языках и т. Д. c.

Заранее спасибо!

...