URL-адрес с R - PullRequest
       21

URL-адрес с R

2 голосов
/ 26 марта 2019

Я пытаюсь очистить содержимое LinkedIn с помощью R, но продолжаю получать сообщение об ошибке при попытке прочитать содержимое HTML.

Это мой код:

install.packages("curl")
library("selectr")
library("xml2")
library("rvest")
library("stringr")
library("curl")
url="https://www.linkedin.com/in/hollyhynes/" 
webpage <- read_html(url)

Ошибка:

Ошибка в open.connection (x, "rb"): ошибка HTTP 999

Я пытался использовать пакет curl:

webpage=read_html(curl("https://www.linkedin.com/in/hollyhynes/",handle 
  = new_handle("useragent" = "Mozilla/5.0")))

но также выдана ошибка:

Ошибка в open.connection (x, "rb"): ошибка HTTP 999.
Дополнительно: Предупреждающие сообщения:
1: в if (! Is.character (x)) x <- структура (as.character (x), names = имена (х)): <br> закрытие неиспользуемого соединения 5 (https://www.linkedin.com/in/hollyhynes/)
2: в if (! Is.character (x)) x <- структура (as.character (x), names = имена (х)): <br> закрытие неиспользуемого соединения 4 (https://www.linkedin.com/in/hollyhynes/)
3: в if (! Is.character (x)) x <- структура (as.character (x), names = имена (х)): <br> закрытие неиспользуемого соединения 3 (https://www.linkedin.com/in/hollyhynes/)

был бы признателен за помощь, как я могу это исправить спасибо:)

...