Я использую VB.Net в приложении ASP.Net 2.0 для запуска некоторых регулярных выражений, которые удаляют ненужную разметку. Одна из вещей, которую я хотел бы сделать, это удалить элементы span, в которых нет атрибутов:
output = Regex.Replace(output, "<span\s*>(?<Text>.*?)</span>" & styleRegex, "${Text}", RegexOptions.Compiled Or RegexOptions.CultureInvariant Or RegexOptions.IgnoreCase Or RegexOptions.Singleline)
Итак, для этого контента:
<span>Lorem <span class="special">ipsum</span> dolor sit amet.</span>
Я хотел бы удалить элементы внешнего пролета. К сожалению, мое регулярное выражение выше дает мне это в результате, так как закрывающий интервал соответствует первому, с которым он сталкивается:
Lorem <span class="special">ipsum dolor sit amet.</span>
Возможно ли это с помощью RegEx или мне придется реализовать что-то более продвинутое?