Я пытаюсь разобрать документ, получить все теги изображений и изменить источник на что-то другое.
$domDocument = new DOMDocument();
$domDocument->loadHTML($text);
$imageNodeList = $domDocument->getElementsByTagName('img');
foreach ($imageNodeList as $Image) {
$Image->setAttribute('src', 'lalala');
$domDocument->saveHTML($Image);
}
$text = $domDocument->saveHTML();
Текст $ изначально выглядит так:
<p><p>Hi, this is a test, here is an image<img src="http://mysite.com/beer.jpg" width="60" height="95" /> Because I like Beer!</p></p>
и это вывод $ text:
<p><!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"><br /><html><body><p>Hi, this is a test, here is an image<img src="lalala" width="68" height="95"> Because I like Beer!</p></body></html></p>
Я получаю кучу дополнительных тегов (html, body и комментарий вверху), которые мне не нужны. Любой способ настроить DOMDocument, чтобы избежать добавления этих дополнительных тегов?
Спасибо!