Извлечь только определенный текст HTML - PullRequest
0 голосов
/ 19 марта 2019

Использование Regex в C # Я могу конвертировать этот текст HTML в открытый текст, но я пытаюсь получить только часть текста по электронной почте. Можно ли получить только тело сообщения этого HTML-кода, а не приветствие или подпись?

<p style="font-size: 11pt;font-family: Times;">December 28, 2018</p>
    <p style="font-size: 11pt;font-family: Times;">Dear Lisa,</p>
    <p style="font-size: 11pt;font-family: Times;"> I would love to grab coffee with you!<br clear="none">When does that work? </p><p style="font-size: 11pt;font-family: Times;">Best Regards,</p>

1 Ответ

0 голосов
/ 19 марта 2019

Я бы предложил HTML-пакет Agility для работы с HTML.Вероятно, вы можете сделать это с помощью пакета Agility HTML:

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml("<p style=\"font - size: 11pt; font - family: Times; \">December 28, 2018</p><p style = \"font-size: 11pt;font-family: Times;\" > Dear Lisa,</ p >" +
                     "<p style=\"font-size: 11pt;font-family: Times;\"> I would love to grab coffee with you!<br clear = \"none\"> When does that work ? </ p >< p style = \"font-size: 11pt;font-family: Times;\" > Best Regards,</ p >");

foreach (var nodeData in doc.DocumentNode.SelectNodes("//text()"))
{
    Console.WriteLine(nodeData.InnerText);
}

Отпечатки:

December 28, 2018

 Dear Lisa,

 I would love to grab coffee with you!

 When does that work ?

 Best Regards,
...