Я подозреваю, что причиной могут быть разные пользовательские агенты.
readLines("https://www.whatismybrowser.com/detect/what-is-my-user-agent") -> z
grep("Your User Agent is", z) -> w
z[seq(w, w+4)]
На linux R 3.5.3 это показывает R (3.5.3 x86_64-pc-linux-gnu x86_64 linux-gnu)
.
На R 3.6.0 mac это показывает libcurl/7.54.0
.
Использование httr::get
z <- rawToChar(httr::GET("https://www.whatismybrowser.com/detect/what-is-my-user-agent")$content)
Пользовательский агент - libcurl/7.54.0 r-curl/3.3 httr/1.4.0
.
А с помощью httr
на сайте:
z <- httr::GET("https://masternodes.online")$content
возвращает 4957
строк независимо от версии R.
Обратите внимание, что вы также можете изменить пользовательский агент вручную и подтвердить:
ua <- user_agent("R (3.5.3 x86_64-pc-linux-gnu x86_64 linux-gnu)")
z <- rawToChar(httr::GET("https://masternodes.online", ua)$content)
Хотя синтаксический анализ немного отличается от readLines
, он выглядит так же.