Это опечатка / ошибка в спецификации W3C XML? - PullRequest
0 голосов
/ 24 февраля 2010

При работе над проблемами с другим вопросом, я нашел текстовые файлы с в них встроено Ctrl-S символов (десятичное 19). При добавлении их текста в документ XML выдается исключение (C # /. NET).

Согласно этой странице, как я ее прочитал, они не в ярости для " Char " и так незаконны: http://www.w3.org/TR/REC-xml/#charsets

Однако когорта нашла спецификацию XML и подразумевает, что она эквивалентна возврату каретки (десятичное 13, а не шестнадцатеричное 0x13), здесь: http://www.w3.org/1999/07/WD-xml-c14n-19990729#charescaping

Но тогда данный абзац не в более поздней версии (http://www.w3.org/TR/xml-c14n), в которой прямо указано:

  • В символьных данных символ возврата каретки (#xD) представлен как "& # xD;".

Итак, два квестона:

  1. Я что-то упустил или на странице W3C есть опечатка - " x " в токене & # x13; там, где должно быть или & # x0d; ??
  2. Если в спецификации есть ошибка (не просто что-то изменившееся, а фактическая ошибка), оставляет ли W3C документ доступным? Похоже, что это "да"

Ответы [ 2 ]

2 голосов
/ 25 февраля 2010

Конечно, для меня это опечатка. Но опечатка в рабочем проекте Canonical XML 1999 года не выглядит поводом для слишком сильного возбуждения.

Это называется «рабочий проект» по причине. Разница между рабочим проектом и опубликованной рекомендацией может быть значительной, поскольку любой, кто использовал XSL-WD, узнал к своему ужасу. W3C не исправляет опечатки в опубликованных черновиках, они публикуют новые версии. Это происходит довольно медленно. Очень медленно, в случае канонического XML, который решает проблему, которую мир, по-видимому, не нуждается в отчаянном решении.

0 голосов
/ 24 февраля 2010

У вас есть один символ, который содержит (десятичный) 19, верно? Эта спецификация XML говорит о побегах символов. Если бы этот символ был допустим в XML, его можно экранировать как или как & # x13 ;. Но это не так. И даже если бы он был экранирован, экранированная версия также не была бы законной.

...