Один из вариантов, который здесь может работать, - использовать curlGetHeaders
, который является частью базы R. Он возвращает вектор символов, содержащий все заголовки для данного входного URL. Вы можете сначала выполнить этот ответ для Content-Type
, а затем проверить тип содержимого.
url <- "http://www.google.com"
headers <- curlGetHeaders(url)
ct <- headers[grep("Content-Type", headers, ignore.case=TRUE)]
# then check the content type for PDF or HTML