я хочу захватить теги заголовка h4, которые не имеют ничего или пробелы в них? - PullRequest
0 голосов
/ 28 июля 2010

у меня есть следующий текст

obart on 18 September 1905. <h4>(^)</h4>Always known as Jack, he had been in the islands  arrived in Rabaul on SS <h4> </h4><i> Montoro</i> to begin a caver, and d="k987" /><a id="k988" /><a id="k989" /><a id="k990" /></p><h4 style="text-align:left;">URGENT – TERRITORY OF NEW GUINEA</h4><br /><div class="quotation">In view of the broadcast that proceed with all speed to Kieta, bringing clothing and bedding. Rations will be provided. <br /></div><div clas:black;size:1px" /><h4 style="text-align:left;"></h4></div></body></html><h4></h4>

у него пять заголовков, я хочу захватить те, в которых нет ничего или есть пробелы, кто-нибудь может мне помочь в этом? я пробовал это однако

(<h4.*?>)([^a-zA-Z0-9]+?)</h4>

но не работает

Ответы [ 2 ]

1 голос
/ 28 июля 2010

Хотя я согласен с эйканалом, что лучшим решением было бы какое-то решение для DOM, регулярное выражение для сопоставления тегов с пустыми или пустыми пробелами должно быть таким простым, как ...

<h4.*?>\\s*?</h4>

NB.Я не знаком с написанием шаблонов регулярных выражений в C #, но думаю, что это должно быть правильно.

0 голосов
/ 28 июля 2010
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...