Как преобразовать файл документации с символами сущности UTF-8 и автоматически преобразовать сущности в правильную шестнадцатеричную последовательность NCR (например, ꯍ
)
Ниже приведен пример текста из файла документации:
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
После преобразования этого в текстовый файл вывод должен быть:
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
Я сделал.
Document document = new Document();
string docPath = @"C:\Users\Tamal\Desktop";
document.LoadFromFile(Path.Combine(docPath,"op.docx"));
document.SaveToFile(Path.Combine(docPath,"op.txt"), FileFormat.Txt);
string readText = File.ReadAllText(Path.Combine(docPath,"op.txt"));
System.Diagnostics.Process.Start(Path.Combine(docPath,"op.txt"));
Console.ReadLine();
Но это выводит текстовый файл как (точно так же, как файл документа):
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
Как и где мне добавить шестнадцатеричное преобразование сущности?
ПРИМЕЧАНИЕ: Я использую Spire.Doc для преобразования документа в txt.