UFT-8 или UTF-8?с или без пробела в конце тега?Таб или Космос? - PullRequest
0 голосов
/ 27 ноября 2010

Мне было интересно узнать:

  1. Должен ли я использовать utf-8 в верхнем или нижнем регистре и почему или для каких случаев он мне нужен в верхнем регистре?

  2. Неправильно ли удалить конечный пробел элемента для экономии места?

    <myElement myAttribute="0" />
    

    до

    <myElement myAttribute="0"/>
    

    Это значит, что у меня огромные файлы от 200 МБ до 1 ГБразмер

  3. Стоит ли использовать TAB или SPACE, если я хочу сэкономить место?

Ответы [ 2 ]

1 голос
/ 27 ноября 2010
  1. Какой контекст?
  2. Нет, вы не можете удалить этот пробел. По крайней мере, если вы хотите выполнить спецификацию XML 1.0.
  3. Один пробел и один символ табуляции требуют ровно один байт каждый. Четыре символа пробела требуют 4 байта, но один символ табуляции и редактор с размером табуляции 4 все еще требует один байт Теперь это ваше решение.
0 голосов
/ 24 октября 2013

1.Должен ли я использовать UTF-8 в верхнем или нижнем регистре и почему или для каких случаев он мне нужен в верхнем регистре?

Я предполагаю, что вы ссылаетесь на декларацию XML:

<?xml version="1.0" encoding="UTF-8"?>

he Наборы символов IANA На странице сказано это сверху:

Имена наборов символов могут содержать до 40 символов, взятых из печатных символов US-ASCII.Однако не делается различий между использованием прописных и строчных букв.

Поэтому я прихожу к выводу, что encoding="UTF-8" и encoding="utf-8" эквивалентны в декларации XML.

2.Разве неправильно удалять конечный пробел элемента для экономии места?

<myElement myAttribute="0" />

<myElement myAttribute="0"/>

<myElement myAttribute></myElement>

Каждое из этих выражений представляет элемент, который не имеет содержимого.Все они семантически эквивалентны.В первом выражении символ пробела, предшествующий />, не имеет значения.(Хотя часто вы будете видеть, что символ пробела добавляется для стиля.)

3.Должен ли я использовать TAB или SPACE, если я хочу сэкономить место?

В кодировке UTF-8 (а также ASCII) TAB и SPACE каждый занимает один байт.Таким образом, если вы используете несколько SPACE символов для отступа, замена каждой группы из SPACE символов одним TAB символом сэкономит место на диске (или уменьшит размер документа XML при сетевой передаче).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...