Как кодировать акценты для запроса Mediawiki API в R? - PullRequest
0 голосов
/ 01 августа 2020

У меня нет проблем с запросом Mediawiki API французской Википедии для строк без диакритических знаков:

string <- 'chien'
string <- stringi::stri_enc_toutf8(string, is_unknown_8bit = FALSE, validate = FALSE)
apiQuery <- paste0('https://fr.wikipedia.org/w/api.php?action=query&format=xml&titles=', string)
page <- xml2::read_xml(apiQuery)

{xml_document} [1] \ n \ n \ n \ n \ n

1 Ответ

1 голос
/ 01 августа 2020

Вам необходимо закодировать запрос в HTML escape-последовательности:

page <- xml2::read_xml(URLencode(apiQuery))

Это изменяет "ê" на "%C3%AA".

...