Предпосылка
Я бы хотел использовать Очиститель HTML для преобразования тегов <body>
в теги <div>
, чтобы сохранить встроенный стиль элемента <body>
, например. <body style="background:color#000000;">Hi there.</body>
превратится в <div style="background:color#000000;">Hi there.</div>
. Я смотрю на комбинацию пользовательского тега и TagTransform
класса.
Текущая настройка
В моем разделе конфигурации я сейчас занимаюсь этим:
$htmlDef = $this->configuration->getHTMLDefinition(true);
// defining the element to avoid triggering 'Element 'body' is not supported'
$bodyElem = $htmlDef->addElement('body', 'Block', 'Flow', 'Core');
$bodyElem->excludes = array('body' => true);
// add the transformation rule
$htmlDef->info_tag_transform['body'] = new HTMLPurifier_TagTransform_Simple('div');
... а также разрешение <body>
и его атрибута style
(и class
, и id
) через директивы конфигурации (они являются частью рабочего, большого списка, который анализируется в HTML.AllowedElements
и HTML.AllowedAttributes
).
Я выключил кэширование определений.
$config->set('Cache.DefinitionImpl', null);
К сожалению, в этой настройке кажется, что HTMLPurifier_TagTransform_Simple
никогда не вызывает метод transform()
.
HTML.Parent
Полагаю, виновником является мой HTML.Parent
, для которого установлено значение 'div'
, поскольку вполне естественно, что <div>
не допускает дочерний элемент <body>
. Однако, установка HTML.Parent
в 'html'
выводит меня из строя:
ErrorException: невозможно использовать нераспознанный элемент в качестве родителя
Добавление ...
$htmlElem = $htmlDef->addElement('html', 'Block', 'Flow', 'Core');
$htmlElem->excludes = array('html' => true);
... избавляется от этого сообщения об ошибке, но по-прежнему не преобразует тег - вместо этого он удаляется.
Добавление ...
$htmlElem = $htmlDef->addElement('html', 'Block', 'Custom: head?, body', 'Core');
$htmlElem->excludes = array('html' => true);
... тоже ничего не делает, потому что выводит сообщение об ошибке:
ErrorException: Trying to get property of non-object
[...]/library/HTMLPurifier/Strategy/FixNesting.php:237
[...]/library/HTMLPurifier/Strategy/Composite.php:18
[...]/library/HTMLPurifier.php:181
[...]
Сейчас я все еще настраиваю последний вариант, пытаясь выяснить точный синтаксис, который мне нужно предоставить, но если кто-то знает, как мне помочь, основываясь на своем собственном прошлом опыте, я был бы признателен за любые указания в правильное направление.
HTML.TidyLevel
Как единственный другой преступник, которого я могу себе представить, мой HTML.TidyLevel
установлен на 'heavy'
. Я еще не попробовал все возможные созвездия на этом, но пока, это не имеет значения.
(Поскольку я только касался этого вторично, я изо всех сил пытаюсь вспомнить, какие созвездия я уже пробовал, чтобы не перечислить их здесь, но, поскольку у меня нет уверенности, я не упущу то, что сделал или что-то не так. Я могу отредактировать этот раздел позже, когда проведу специальное тестирование!)
Полная настройка
Мои данные конфигурации сохраняются в JSON, а затем анализируются в HTML Purifier. Вот файл:
{
"CSS" : {
"MaxImgLength" : "800px"
},
"Core" : {
"CollectErrors" : true,
"HiddenElements" : {
"script" : true,
"style" : true,
"iframe" : true,
"noframes" : true
},
"RemoveInvalidImg" : false
},
"Filter" : {
"ExtractStyleBlocks" : true
},
"HTML" : {
"MaxImgLength" : 800,
"TidyLevel" : "heavy",
"Doctype" : "XHTML 1.0 Transitional",
"Parent" : "html"
},
"Output" : {
"TidyFormat" : true
},
"Test" : {
"ForceNoIconv" : true
},
"URI" : {
"AllowedSchemes" : {
"http" : true,
"https" : true,
"mailto" : true,
"ftp" : true
},
"DisableExternalResources" : true
}
}
(URI.Base
, URI.Munge
и Cache.SerializerPath
также установлены, но я удалил их в этой пасте. Также, HTML.Parent
Предостережение: Как уже упоминалось, обычно это 'div'
.)