Каждый символ в документе XML является символом Unicode, если бы были символы, отличные от Unicode, то у вас действительно были бы проблемы.
Ваша настоящая проблема заключается в том, что документ использует кодировку символов Unicode, "\u001f ", который парсеры XML не распознают.Это совершенно законный XML-контент, просто он будет рассматриваться как последовательность из 6 символов, начинающаяся с обратной косой черты, а не как представление управляющего символа x1F (который, как это бывает, не является символом, разрешенным XML 1.0).
Одним из способов работы с этими символами будет трактовка "+30 6973222259 \ u001f" как строки JSON и использование функции XQuery 3.1 json-to-xml()
для преобразования ее в XML (для этого требуется наличиецитаты).Однако это создаст вам проблемы, если есть escape-последовательности, которые преобразуются в символы, которые XML не разрешает, например \u0000
.Функция json-to-xml()
имеет различные варианты действий в таких ситуациях.