Я читаю документ XML, который содержит символ é
(e острый).Документ был сохранен как UTF-8, и я подтвердил, что это символ UTF-8 с двоичным устройством чтения файлов (это c3
+ a9
).Однако после обработки символ становится трехбайтовым беспорядком (c3
+ 83
+ c2
).
Я предполагаю, что .NET пытался преобразовать символ (ы) в UTF-16 (это мое лучшее предположение) или разделил символ на один однобайтовый символ и один двухбайтовый UTF-8 символов.
Я загружаю документ следующим образом:
XmlDocuments document = new XmlDocuments();
document.Load("z:\\source.xml");
Как мне загрузить это?Должен ли я читать это через поток в кодировке UTF-8?
[Edit]
Я забыл упомянуть, что загружаемый документ объявляет себя как UTF-8.
<?xml version="1.0" encoding="utf-8"?>