Я использую HtmlAgilityPack, чтобы прочитать синтаксический анализ html-файла и извлечь некоторый текст:
static void Main(string[] args)
{
var webGet = new HtmlWeb();
var document = webGet.Load("http://port.ro/");
var programs = from program in document.DocumentNode.Descendants()
where program.Name == "a" && program.Attributes["href"] != null && program.InnerText.Trim().Length > 0
select program.InnerText ;
foreach (string s in programs)
{
Console.WriteLine(s);
}
Console.ReadLine();
}
Моя проблема в том, что веб-сайт содержит символы типа à
, и когда я их печатаю, они заменяются на ?
.
Что мне нужно сделать, когда я печатаю текст, символ à
заменяется на a
или печатается как à
?