удаление исторических данных с использованием раскрывающегося списка - PullRequest
0 голосов
/ 06 октября 2019

Я пытаюсь извлечь данные из https://www.accessdata.fda.gov/scripts/cder/daf/index.cfm?event=reportsSearch.process. Как видите, есть раскрывающееся меню для вызова исторических данных. Однако ссылка не связана с диапазоном дат. Следовательно, я не могу создать цикл rvest для перехода к соответствующей дате и списания данных. Как я могу получить исторические данные об одобрении препарата с этой страницы при таких обстоятельствах?

1 Ответ

1 голос
/ 06 октября 2019

URL-адрес, например, для июля 2019 года, выглядит как "https://www.accessdata.fda.gov/scripts/cder/daf/index.cfm?event=reportsSearch.process&rptName=0&reportSelectMonth=7&reportSelectYear=2019", поэтому вы можете создать цикл для месяцев и лет, применить их к частям URL-адреса reportSelectMonth и reportSelectYear и вызвать read_html () длякаждый из динамически создаваемых URL?

Если вы хотите, например, весь 2017 и 2018 годы, вы можете сделать:

library(rvest)
baseUrl <- "https://www.accessdata.fda.gov/scripts/cder/daf/index.cfm?event=reportsSearch.process&rptName=0&"
for (year in 2017:2018) {
    for (month in 1:12) {
        url <- paste0(baseUrl, "&reportSelectMonth=", month, "&reportSelectYear=", year)
        p <- read_html(url)
        # do stuff
    } 
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...