Ошибка функции при проверке, существуют ли URL в R (http_error / url.exists) - PullRequest
0 голосов
/ 15 октября 2018

Я хотел бы проверить, работают ли некоторые URL-адреса относительно курсов Udemy.Давайте начнем с URL:

# URL which contains a course that has been removed from Udemy
url_noCourse <- "https://www.udemy.com/draft/1564158/?siteID=RUxZriH.PWc-x2v27L1vQgG_VZYYYDliMg&LSNPUBID=RUxZriH*PWc"

# URL which contains a course that is still on Udemy
url_yesCourse <- "https://www.udemy.com/lx0-104-comptia-linux-powered-by-lpi-practice-test-d/?siteID=RUxZriH.PWc-m4fhEs8ft5XtkpJM31f.Bg&LSNPUBID=RUxZriH*PWc"

Я хотел бы получить логическое значение (TRUE / FALSE), если курс существует или нет.Таким образом, url_noCourse должно быть FALSE, а url_yesCourse должно быть TRUE.

Однако при использовании функций url.exists() из пакета RCurl и http_error() из httrпакет, они, кажется, не в состоянии различить, какой курс все еще находится на платформе, а какой нет.

> http_error(url_noCourse)
[1] TRUE
> http_error(url_yesCourse)
[1] TRUE
> url.exists(url_noCourse)
[1] FALSE
> url.exists(url_yesCourse)
[1] FALSE

С http_error() все курсы TRUE и с url.exists() все ониFALSE.

Я читаю разные вопросы на этом форуме ( 1 , 2 , 3 ), но ни один из них не появляетсябыть полезным в моем случае.

Есть идеи, как решить эту проблему в R?

...