Я хотел бы проверить, работают ли некоторые URL-адреса относительно курсов Udemy.Давайте начнем с URL:
# URL which contains a course that has been removed from Udemy
url_noCourse <- "https://www.udemy.com/draft/1564158/?siteID=RUxZriH.PWc-x2v27L1vQgG_VZYYYDliMg&LSNPUBID=RUxZriH*PWc"
# URL which contains a course that is still on Udemy
url_yesCourse <- "https://www.udemy.com/lx0-104-comptia-linux-powered-by-lpi-practice-test-d/?siteID=RUxZriH.PWc-m4fhEs8ft5XtkpJM31f.Bg&LSNPUBID=RUxZriH*PWc"
Я хотел бы получить логическое значение (TRUE
/ FALSE
), если курс существует или нет.Таким образом, url_noCourse
должно быть FALSE
, а url_yesCourse
должно быть TRUE
.
Однако при использовании функций url.exists()
из пакета RCurl
и http_error()
из httr
пакет, они, кажется, не в состоянии различить, какой курс все еще находится на платформе, а какой нет.
> http_error(url_noCourse)
[1] TRUE
> http_error(url_yesCourse)
[1] TRUE
> url.exists(url_noCourse)
[1] FALSE
> url.exists(url_yesCourse)
[1] FALSE
С http_error()
все курсы TRUE
и с url.exists()
все ониFALSE
.
Я читаю разные вопросы на этом форуме ( 1 , 2 , 3 ), но ни один из них не появляетсябыть полезным в моем случае.
Есть идеи, как решить эту проблему в R?