Я пытаюсь извлечь все ссылки для таблицы, которая выглядит примерно так:
<!DOCTYPE html>
<html>
<body>
<table>
<tr>
<td>
<a href="https://www.r-project.org/">R</a><br>
<a href="https://www.rstudio.com/">RStudio</a>
</td>
</tr>
<tr>
<td>
<a href="https://community.rstudio.com/">Rstudio Community</a>
</td>
</tr>
</table>
</body>
</html>
Что я хотел бы сделать, это получить список фреймов данных (или вектора) в конце, где каждый фрейм данных содержит все ссылки для каждой строки в таблице html. Например, в этом случае список будет иметь вектор 1 с c("https://www.r-project.org/","https://www.rstudio.com/")
, а второй вектор будет c("https://community.rstudio.com/")
. Основная проблема, с которой я сталкиваюсь сейчас, заключается в том, что я не могу сохранить отношение href к каждому узлу, когда я делаю следующее:
library(rvest)
web <- read_html("table.html") %>%
html_nodes("table") %>%
html_nodes("tr") %>%
html_nodes("a") %>%
html_attr("href")