Как преобразовать URL-адреса t.co в большие URL-адреса? - PullRequest
0 голосов
/ 27 мая 2019

Я пытаюсь понять, как преобразовать URL-адреса t.co в большие URL-адреса?

У меня есть набор данных из 7 175 URL-адресов t.co.Я вроде как конвертировать отдельные URL в большие (используя httr::GET).Однако, когда речь идет о 7 175 URL, я должен использовать sapply, чтобы применить функцию Get ко всем URL (в R это может быть сделано с помощью пакета httr).

Например, предположим, что имя моего набора данных - "urls_common" с двумя переменными: source_url (который содержит URL-адреса t.co) и количество каждого URL-адреса.Я использую следующий набор кодов для преобразования t.co в большие URL.

urls <- t(sapply(urls_common$source_url, GET)) %>%
  as_tibble() %>%
  select(urls, status_code)

Но я получаю разные ошибки, такие как:

Ошибка в curl :: curl_fetch_memory (url, handle = handle): не удалось подключиться к порту 80 jamaica-gleaner.com: соединение отклонено

ИЛИ

Ошибка в curl :: curl_fetch_memory (url, handle= handle): Пустой ответ от сервера

Когда я запускаю вышеуказанные коды для небольших наборов данных (например, первый или второй или третий URL-адрес 500 t.co), он иногда хорошо работает для некоторых наборов данных,иногда получаются следующие ошибки:

Ошибка в curl :: curl_fetch_memory (url, handle = handle): не удается разрешить хост: my-news-feed.com

Ошибка вcurl :: curl_fetch_memory (url, handle = handle): проблема с сертификатом SSL: срок действия сертификата истек

Ошибка в curl :: curl_fetch_memory (url, handle = handle): не удалось разрешить хост: experience.safety

Буду признателен, если вы поможете мне получить этоошибка исправлена.

...