Ошибка в nchar (desc): недопустимая многобайтовая строка, элемент 1 при просмотре веб-страниц при использовании map () и rvest - PullRequest
1 голос
/ 26 сентября 2019

Я пытаюсь более эффективно очистить несколько веб-страниц с помощью purrrs::map().Если я использую read_html() для каждой ссылки отдельно, она работает, однако, если я пытаюсь добиться того же с помощью map(), R возвращает

Ошибка в nchar (desc): недействительномногобайтовая строка, элемент 1

Ниже я вставил минимальный воспроизводимый пример.Кажется, что с самой строкой все в порядке, я ввел несколько строк как Vector в tmp и всегда получал одну и ту же ошибку.Как мне это исправить?

library(rvest)
library(tidyverse)
tmp <- c("https://www.r-bloggers.com/web-scraping-and-invalid-multibyte-string/","https://blog.rstudio.com/2014/11/24/rvest-easy-web-scraping-with-r/")
tmp
# does not work
map(tmp,read_html)
# works
read_html(tmp[1])
read_html(tmp[2])

# suggestion 1
Sys.setlocale("LC_CTYPE", "en_US.UTF-8")
# does still not work
map(tmp,read_html)
# works
read_html(tmp[1])
read_html(tmp[2])

Sys.setlocale("LC_ALL", "English")

# does still not work
map(tmp,read_html)
# works
read_html(tmp[1])
read_html(tmp[2])
...