Вам не нужен очиститель HTML.Класс DOMDocument позаботится обо всем за вас.Однако это вызовет предупреждение о недействительном html, поэтому просто сделайте следующее:
$doc = new DOMDocument();
@$doc->loadHTML($content);
Тогда ошибка не будет вызвана, и вы можете делать то, что вы хотите с HTML.Если вы очищаете ссылки, я бы порекомендовал вам использовать SimpleXMLElement :: xpath ();Это намного проще, чем работать с DOMDocument.Другой пример:
$xml = new SimpleXMLElement($content);
$result = $xml->xpath('a/@href');
print_r($result);
Вы можете получить гораздо более сложные xpath, которые позволяют вам указывать имена классов, идентификаторы и другие атрибуты.Это намного мощнее, чем DOMDocument.