Я использовал HTMLPurifier для санации выходных данных редактора форматированного текста, и в итоге получил:
include_once('htmlpurifier/library/HTMLPurifier.auto.php');
$config = HTMLPurifier_Config::createDefault();
$config->set('Core', 'Encoding', 'UTF-8');
$config->set('HTML', 'Doctype', 'HTML 4.01 Transitional');
if (defined('PURIFIER_CACHE')) {
$config->set('Cache', 'SerializerPath', PURIFIER_CACHE);
} else {
# Disable the cache entirely
$config->set('Cache', 'DefinitionImpl', null);
}
# Help out the Purifier a bit, until it develops this functionality
while (($cleaner = preg_replace('!<(em|strong)>(\s*)</\1>!', '$2', $input)) != $input) {
$input = $cleaner;
}
$filter = new HTMLPurifier($config);
$output = $filter->purify($input);
Основные достопримечательности:
- Включитеавтозагрузчик.
- Создайте экземпляр
HTMLPurifier_Config
как $config
. - Установите необходимые параметры конфигурации с помощью
$config->set()
. - Создайте экземпляр
HTMLPurifier
, передав ему $config
. - Используйте
$filter->purify()
в качестве входных данных.
Однако, это полностью излишне для чего-то, что не должно допускать никакого HTML в выводе.