Мне было интересно, может ли кто-нибудь помочь мне использовать разделение строк, чтобы получить все вхождения текста между тегами <p> </p> в HTML-документе?
<p>
</p>
Похоже, вы хотите посмотреть на HTML Agility Pack . Он очень хорошо работает на хитрых HTML-документах!
Посмотрите на регулярные выражения. Разделение строк не является хорошим решением.
Это довольно большая проблема для String.Split(). Я бы рекомендовал вместо этого использовать анализатор XML.
String.Split()
В интересах людей, которые предлагают RegEx, могу я просто указать на этот ответ:
RegEx соответствует открытым тегам, кроме автономных тегов XHTML (переполнение стека)
Просто скажи нет.
Я делал это вручную, просто перебирая строку в цикле и считая теги <p>, и если вы нашли один <p, а затем другой <p и другой, а затем у вас вдруг появляется </p> чем вы должны ждать, пока вы не найдете 3-й </p> и там у вас есть
<p