Могу ли я включить такие символы, как «ã» и «ê» в кодировку UTF-8, или это кодировка UTF-16? - PullRequest
1 голос
/ 05 февраля 2010

Могу ли я включить такие символы, как "ã" и "ê" в XML-кодировку UTF-8, или это кодировка UTF-16?

Ответы [ 2 ]

7 голосов
/ 05 февраля 2010

Вы можете кодировать эти символы в UTF-8.

Ключ заключается в том, чтобы обеспечить постоянство пролога (<?xml version="1.0" encoding="utf-8" ?>) и фактической кодировки файлов.

Весь смысл UTF-8 в том, чтобы иметь возможность кодировать все символы Юникода в меньшем размере. Согласно источнику всей мудрости, wikipedia , utf-8 кодирует каждую символьную точку от 1 до 4 байтов и обратно совместим с ASCII

6 голосов
/ 05 февраля 2010

Все кодировки Unicode Transformation Format могут кодировать любой символ, найденный в Unicode. Указанные символы содержатся в стандарте Unicode.

...