Соскоб с помощью R - таблица из многих страниц - PullRequest
0 голосов
/ 05 мая 2018

У меня есть этот сайт, на котором есть таблица из многих страниц. Может кто-нибудь помочь мне прочитать все страницы этой таблицы в R?

Веб-сайт: https://www.fdic.gov/bank/individual/failed/banklist.html

1 Ответ

0 голосов
/ 05 мая 2018

Вы можете очистить всю таблицу HTML, используя пакет rvest. Смотрите код ниже. Код автоматически идентифицирует всю таблицу и считывает все 555 записей.

require(rvest)

URL <- "https://www.fdic.gov/bank/individual/failed/banklist.html"

failed_banks <- URL %>%
  read_html() %>%
  html_table() %>%
  as.data.frame()
...