Расщепление строки в C # - PullRequest
       16

Расщепление строки в C #

0 голосов
/ 18 ноября 2009

Мне было интересно, может ли кто-нибудь помочь мне использовать разделение строк, чтобы получить все вхождения текста между тегами <p> </p> в HTML-документе?

Ответы [ 5 ]

6 голосов
/ 18 ноября 2009

Похоже, вы хотите посмотреть на HTML Agility Pack . Он очень хорошо работает на хитрых HTML-документах!

2 голосов
/ 18 ноября 2009

Посмотрите на регулярные выражения. Разделение строк не является хорошим решением.

2 голосов
/ 18 ноября 2009

Это довольно большая проблема для String.Split(). Я бы рекомендовал вместо этого использовать анализатор XML.

1 голос
/ 18 ноября 2009

В интересах людей, которые предлагают RegEx, могу я просто указать на этот ответ:

RegEx соответствует открытым тегам, кроме автономных тегов XHTML (переполнение стека)

Просто скажи нет.

0 голосов
/ 18 ноября 2009

Я делал это вручную, просто перебирая строку в цикле и считая теги <p>, и если вы нашли один <p, а затем другой <p и другой, а затем у вас вдруг появляется </p> чем вы должны ждать, пока вы не найдете 3-й </p> и там у вас есть

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...