Преобразование документа в TXT, а также преобразование объектов с помощью C #? - PullRequest
0 голосов
/ 06 мая 2018

Как преобразовать файл документации с символами сущности UTF-8 и автоматически преобразовать сущности в правильную шестнадцатеричную последовательность NCR (например, ꯍ)

Ниже приведен пример текста из файла документации:

Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.

После преобразования этого в текстовый файл вывод должен быть:

Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.

Я сделал.

Document document = new Document();

    string docPath = @"C:\Users\Tamal\Desktop";
    document.LoadFromFile(Path.Combine(docPath,"op.docx"));
    document.SaveToFile(Path.Combine(docPath,"op.txt"), FileFormat.Txt);

    string readText = File.ReadAllText(Path.Combine(docPath,"op.txt"));
    System.Diagnostics.Process.Start(Path.Combine(docPath,"op.txt"));
    Console.ReadLine();

Но это выводит текстовый файл как (точно так же, как файл документа):

Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.

Как и где мне добавить шестнадцатеричное преобразование сущности?

ПРИМЕЧАНИЕ: Я использую Spire.Doc для преобразования документа в txt.

1 Ответ

0 голосов
/ 06 мая 2018

Запустите вашу строку через System.Net.WebUtility.HtmlEncode (string)

...