XElement не может загрузить файл с акцентированными символами - PullRequest
4 голосов
/ 04 января 2011

У меня довольно любопытная проблема: я использую метод загрузки XElement для загрузки в html-документ (который хорошо сформирован, проверен с помощью HTML Tidy), который работает абсолютно идеально для английских документов, однако переходя на французские и испанские документы представлен с исключением XML;

XML Exception
Invalid character in the given encoding. Line 23, position 43.

вызов метода

XElement doc = XElement.Load("example1.html", LoadOptions.None);

Фрагмент HTML-документа

<font face="Arial" size="3" color="#ffffff">
Le test <b> exemple français, qui devrait éventuellement être suivie d'un texte en langue espagnole. </ b>
</font>

Я понимаю, что в моем HTML не задан тип кодировки в начале файла, есть ли способ обойти это?

1 Ответ

3 голосов
/ 04 января 2011

, поскольку вы не используете XDocument, вы не можете установить кодировку символов, используйте вместо этого кодировку = UTF-8

http://msdn.microsoft.com/en-us/library/bb387063.aspx

...