HTML-файл, отображающий вопросительные знаки в R вместо символов иврита - PullRequest
0 голосов
/ 01 июня 2019

R поддерживает ввод и вывод на иврите для всех типов файлов, кроме моих htm-файлов.

Я попытался установить язык и кодировку в R и сохранить файл htm с кодировкой UTF-8.Проблема не в R, а в самом файле htm, потому что он отображается в текстовом редакторе;однако, он правильно отображается в окне предварительного просмотра.

Вот купольный код, который я уже пробовал в R.

Sys.setlocale("LC_ALL","Hebrew")
locale = locale(date_names = "he", encoding = "UTF-8"))
locale("he") 

Вот как выглядят файлы, когда я печатаю их в консоли R ...

    <!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//HE\">\n<HTML DIR=\"RTL\" LANG=\"HE\">\n<HEAD>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset==Windows-1255\">\n<!--Copyright 2003 Mechon Mamre, 12 Hayyim Vital, Jerusalem-->\n<LINK REL=\"stylesheet\" HREF=\"x.css\" TYPE=\"text/css\">\n<TITLE>??\"? ????? ?????? - ??????" 

Я исправил эту проблему раньше ... Я думаю, что я просто сохранил файлы как UTF-8, но недавно я перешел с Windows 10 на Ubuntu 18, и этопросто больше не работает

1 Ответ

0 голосов
/ 17 июля 2019

Похоже, вы запросили R прочитать UTF-8, а файл - cp-1255.

Вы должны повторно сохранить файл как UTF-8 (и соответствующим образом обновить заголовок).

...