Я пытаюсь прочитать HTML из текстового файла с разделителями табуляции и создаю файл HTML, который затем преобразую в pdf. Когда я пытаюсь прочитать текстовый файл, я получаю странные символы для 'и некоторых других символов. Вот мой код
var lines = System.IO.File.ReadAllLines(@"C:\temp\Laura.txt", Encoding.GetEncoding("Windows-1255"));
var csv = lines.Select(x =>
{
var parts = x.Split('\t');
return new Articles()
{
id = parts[0].Trim(),
name = parts[1].Trim(),
body = parts[2].Trim(),
//body = WebUtility.HtmlDecode(parts[2].Trim()),
//body = HttpUtility.HtmlEncode(parts[2].Trim()),
//body = WebUtility.HtmlEncode(parts[2].Trim()),
//body = SecurityElement.Escape(parts[2].Trim()),
};
}).ToList();
foreach (var item in csv)
{
string id = item.name;
string filename = item.name + ".html";
string body = item.body;
string path = @"c:\temp\" + filename;
// This text is added only once to the file.
if (!File.Exists(path))
{
// Create a file to write to.
File.WriteAllText(path, body);
Microsoft.Office.Interop.Word.Application ap = new Microsoft.Office.Interop.Word.Application();
Document document = ap.Documents.Open(path);
object oFalse = false;
object oTrue = true;
object OutputFileName = Path.Combine(
Path.GetDirectoryName(path),
Path.GetFileNameWithoutExtension(path) + ".pdf");
object missing = System.Reflection.Missing.Value;
document.PrintOut(
oTrue, // Background
oFalse, // Append
ref missing, // Range
OutputFileName, // OutputFileName
ref missing, // From
ref missing, // To
ref missing, // Item
ref missing, // Copies
ref missing, // Pages
ref missing, // PageType
ref missing, // PrintToFile
ref missing, // Collate
ref missing, // ActivePrinterMacGX
ref missing, // ManualDuplexPrint
ref missing, // PrintZoomColumn
ref missing, // PrintZoomRow
ref missing, // PrintZoomPaperWidth
ref missing // PrintZoomPaperHeight
);
}
}
Я пробовал закомментированный код, но, похоже, ничего не работает.