Мне нужно проанализировать HTML-документ, чтобы извлечь все теги H1 и весь HTML между ними. Я играл с HtmlAgilityPack, чтобы добиться этого с некоторым успехом. Я мог бы извлечь все теги H1, используя:
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//h1"))
Но как мне извлечь весь HTML после каждого тега H1, пока я не нажму следующий тег H1? Этот HTML может включать в себя что-либо из таблицы / изображения / ссылки или любую другую вещь на странице HTML, кроме тега H1.
Заранее спасибо.