Я работаю над небольшим скриптом Python для очистки HTML-документов. Он работает, принимая список тегов в KEEP, а затем анализируя теги удаления кода HTML, которых нет в списке. Я использовал для этого регулярные выражения и смог сопоставить открывающие и самозакрывающиеся теги но не закрывающие теги.
Шаблон, с которым я экспериментировал, чтобы соответствовать закрывающим тегам, </(?!a)>
. Это кажется мне логичным, так почему не работает? (?!a)
должно совпадать с любым, что НЕ является тегом привязки (не то, что «a» может быть чем угодно - это просто пример).
Редактировать: AGG! Я думаю, что регулярное выражение не показывалось!