Неверный XML Символ не отображается в тексте при чтении из файла, но отображается при жестком кодировании - PullRequest
0 голосов
/ 15 февраля 2020

Я пытаюсь очистить строку для недопустимого символа xml. Я читаю его из файла, но этот символ не является недопустимым. Например: \ u0000 идет как есть.

string output = Regex.Replace(text, @"[\u0000-\u0008\u000B\u000C\u000E-\u001F]", "");

не может заменить символ \ u0000. Чтение файла с использованием приведенного ниже кода, в режиме отладки текст имеет символ \ u0000 как есть. Это должно быть показано как ноль. может быть, поэтому Regex не может конвертировать его.

string text = System.IO.File.ReadAllText(@"C:\Users\Public\file.txt", Encoding.UTF8);

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...