R: автоматически «переводить» сокращенные URL из данных Twitter - PullRequest
0 голосов
/ 28 сентября 2019

Я ищу способ автоматически «переводить» сокращенные URL-адреса из Twitter на исходный URL-адрес.

Я удалил пару строк Twitter, используя следующий код:

tweets <- userTimeline("exampleuser", n = 3200, includeRts=TRUE)
tweets_df <- tbl_df(map_df(tweets, as.data.frame))

Затем я отделил сокращенные URL-адреса от остального текста твита, чтобы у меня в отдельном столбце данных был только сокращенный URL-адрес.

Теперь я ищу способ автоматической очистки всех этихURL-адреса, которые перенаправляют на различные веб-сайты и получают новый столбец с исходным (т. Е. Не сокращенным) URL-адресом.

Кто-нибудь знает, как мне это сделать в R?

Спасибо, Мануэль

1 Ответ

0 голосов
/ 28 сентября 2019

Вы можете использовать пакет httr.

httr::HEAD("URL") даст вам ответ в первой строке, а затем вы можете выполнить обычную очистку, чтобы получить только URL-адреса.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...