Кодировка символов, UTF или ANSI? - PullRequest
0 голосов
/ 13 апреля 2010

Я использую Eclipse в Ubuntu для редактирования файлов PHP.

Но, к сожалению, некоторые из этих файлов PHP были созданы в Notepad ++ в Windows XP с определенной кодировкой ANSI.

Кроме того, эти файлы генерируют HTML-коды с набором символов = ISO-8859-1.

Когда я настроил Eclipse на ISO-8859-1, многие специальные символы были утеряны и заменены на «???», а когда я пытаюсь сохранить файл с ISO, Eclipse отображает ошибку, которую невозможно сохранить файл, потому что некоторые символы не совместимы с кодировкой.

Как сохранить эти файлы без изменения кодировки или как изменить кодировку без потери символов.

Ответы [ 3 ]

3 голосов
/ 13 апреля 2010

Кстати, вам нужно прочитать эти файлы, используя кодировку ANSI, а затем записать эти файлы, используя кодировку ISO-8859-1. В Notepad ++ вы можете изменить кодировку с помощью пункта меню Формат . К сожалению, нет опции ISO-8859-1, но UTF-8 должно быть достаточно и в настоящее время также является предпочтительным выбором для мирового господства, поскольку кодировка ISO-8859-1 охватывает только латинские символы, но не, например, кириллицу, греческий, китайский, арабский и т. Д.

2 голосов
/ 13 апреля 2010

Под "ANSI" вы подразумеваете "кодовую страницу Windows 1252"?

В любом случае, выяснив исходную кодировку, вы можете использовать iconv для преобразования из этой кодировки в UTF-8.

1 голос
/ 17 июня 2010

Последняя версия может конвертировать между ISO-8859-1 и UTF-8 без потери информации. версия 5.6.8 может это сделать.

...