HTML Agility Pack - хорошая библиотека для такой работы.
Вы не указали, структурировано ли все таким образом, или вы уже получилитип фрагмента, который вы разместили в файлах HTML, поэтому советовать его сложно.
В общем, если все страницы структурированы одинаково, я бы использовал выражение XPath для извлечения абзаца и выбора innerHtml
или innerText
с каждой страницы.
Что-то вроде следующего:
var description = htmlDoc.SelectNodes("p[@class='content_txt']")[0].innerText;