Я использую регулярные выражения .NET для удаления кода HTML.
Используя что-то вроде:
<title>(?<Title>[\w\W]+?)</title>[\w\W]+?<div class="article">(?<Text>[\w\W]+?)</div>
Это работает в 99% случаев, но иногда при разборе ...
Regex.IsMatch(HTML, Pattern)
Парсер просто блокируется, и он будет продолжать работать с этой строкой кода в течение нескольких минут или неопределенно долго.
Что происходит?