XMLReader разбивается на странный символ - PullRequest
0 голосов
/ 21 октября 2011

Всякий раз, когда XMLReader пытался проанализировать этот XML-файл, который я им передаю, он разбивается на «½» и на период, который выглядит следующим образом «.»

Это символы, которые каждый раз, когда я пытаюсь удалить их из канала xml, редактор сначала удаляет символы перед ними. Таким образом, они действуют как иностранные / разные символы кодирования.

Какие есть варианты, чтобы это исправить? Я не могу редактировать XML-файл каждый раз. Большое спасибо

1 Ответ

0 голосов
/ 22 октября 2011

Вы должны исправить программу или процесс, который создает файл «XML».(Я помещаю «XML» в кавычки, потому что на самом деле вы хотели бы, чтобы это был XML-файл, но это не тот файл.) Возможно, вы сможете исправить или восстановить или восстановить данные, но это не надолго.решение.

По неподтвержденным данным, символ "½" кодируется в виде двух байтов, предполагая, что он кодируется как UTF-8, а символ "é" - в виде одного байта, что означаетISO 8859-1.Это означает, что два разных процесса записали в файл, записав в него, используя разные кодировки.(Возможно, он был изначально создан в одной кодировке, а затем изменен с помощью редактора, который не знал, что такое оригинальная кодировка.) Это не сработает.

...