Хорошо, давайте разделим вопрос о (1) символах, которые вообще недопустимы в любом документе XML, и (2) символах, которые необходимо экранировать:
Ответ, предоставленный @dolmen Недопустимые символы в XML все еще действителен, но его необходимо обновить с помощью спецификации XML 1.1.
1. Недопустимые символы
Описанные здесь символы - это все символы, которые разрешено вставлять в документ XML.
1.1. В XML 1.0
Глобальный список разрешенных символов:
[2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */
Как правило, управляющие символы и символы вне диапазона Unicode не допускаются.
Это также означает, что вызов, например, символьной сущности 
запрещен.
* * 1.2 тысячу двадцать восемь. В XML 1.1
Глобальный список разрешенных символов:
[2] Char ::= [#x1-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */
[2a] RestrictedChar ::= [#x1-#x8] | [#xB-#xC] | [#xE-#x1F] | [#x7F-#x84] | [#x86-#x9F]
Эта редакция рекомендации XML расширила допустимые символы, поэтому разрешены управляющие символы, и учитывает новую редакцию стандарта Unicode, но они все еще недопустимы: NUL (x00), xFFFE , xFFFF ...
Однако использование управляющих символов и неопределенного символа Unicode не рекомендуется.
Также можно заметить, что не все синтаксические анализаторы принимают это во внимание, и документы XML с управляющими символами могут быть отклонены.
2. Символы, которые необходимо экранировать (чтобы получить правильно оформленный документ):
<
необходимо экранировать с помощью сущности <
, поскольку предполагается, что она является началом тега.
&
необходимо экранировать с помощью сущности &
, поскольку предполагается, что она является началом ссылки на сущность
>
следует экранировать с помощью >
сущности. Это не обязательно - это зависит от контекста - но настоятельно рекомендуется избегать его.
'
следует экранировать с помощью сущности '
- обязательно в атрибутах, определенных в одинарных кавычках, но настоятельно рекомендуется всегда избегать его.
"
следует экранировать с помощью сущности "
- обязательно в атрибутах, определенных в двойных кавычках, но настоятельно рекомендуется всегда избегать его.