Проблемы с кодированием при отображении неанглийского текста в средстве просмотра Rstudio - PullRequest
1 голос
/ 23 апреля 2019

Я использую функцию lda serVis() для отображения набора терминов, проанализированных на большом корпусе восточноазиатских символов (упрощенный китайский и японский), но мой Rstudio зритель не может правильно отобразить этот текст ( он может отображать только чисто английский текст), как показано ниже

enter image description here

Понятно, что это связано с проблемой кодирования RStudio, поэтому я воспользовался чьим-то предложением, используя функцию writeLines(), чтобы изменить кодировку по умолчанию на UTF-8 для размещения некоторых из этих иностранных текстов:

writeLines(iconv(readLines("./vis/lda.json"), from = "GBK", to = "UTF-8"), file("./vis/lda.json", encoding="UTF-8"))

Обратите внимание, что serVis() принимает GBK по умолчанию при обработке упрощенного китайского текста.

Затем я reload зритель, чтобы увидеть, если это влияет на дисплей зрителя, но ничего не изменилось.

Моя вторая попытка состояла в том, чтобы щелкнуть по папке vis, автоматически созданной serVis, открыв ее в блокноте и изменив кодировку на UTF-8 и, опять же, reload вьюер, но все равно ничего не изменилось.

Я читал несколько тем на этом форуме и github, все они указывали на те же решения, что и выше, но они не работали в моем случае. Буду очень признателен, если кто-нибудь сможет помочь мне просветить меня в этом.

...