Прежде чем мы начнем, strip_tags () не работает.
сейчас,
У меня есть некоторые данные, которые нужно проанализировать, проблема в том, что мне нужно избавиться от всего HTML, который был очень странно отформатирован.
теги выглядят так:
(обратите внимание на пробелы)
< p > blah blah blah < / p > < a href= " link.html " > blah blah blah < /a >
Все регулярные выражения, которые я пробовал, не работают, и я не знаю достаточно о форматировании регулярных выражений, чтобы заставить их работать. Меня не волнует сохранение чего-либо внутри тегов, и я бы предпочел избавиться от текста внутри ссылки, если бы мог.
У кого-нибудь есть идеи?
(мне действительно нужно однажды сесть и выучить регулярные выражения)