Это обсуждалось буквально десятки раз уже на StackOverflow (и тысячи раз на других форумах), но, очевидно, это все еще нуждается в повторении: это невозможно сделать .
Регулярные выражения могут анализировать только обычные языки. HTML не Обычный язык. Доказательство того, что вы не можете анализировать HTML с помощью регулярных выражений, является обычным (каламбурным) домашним заданием почти во всех колледжах и университетах на планете. Это доказали буквально десятки тысяч людей. Он настолько водонепроницаем, насколько может быть математическое доказательство. Это очень короткое, очень простое, очень доступное доказательство. Никто не сможет найти в нем скрытый недостаток, потому что доказательство настолько простое и маленькое, что просто нигде недостаток не может скрыть.
О, и я упоминал , что нельзя сделать ?
Это не проблема коммивояжера, для выполнения которой требуется очень много времени . Это не P = NP, где мы не знаем, правда это или нет.
Это действительно, абсолютно, на 100%, положительно, полностью, доказуемо невозможно.
Я забыл. Я уже упоминал , что нельзя сделать ?