Удалить узел из файла XML при чтении его с помощью XmlReader? - PullRequest
0 голосов
/ 09 ноября 2018

У меня есть скрипт, который читает XML узел за узлом, используя XMLReader:

$z = new XMLReader;
$z->open('xmlfile.xml');
$doc = new DOMDocument;

while ($z->read() && $z->name !== 'item');
while ($z->name === 'item')
{
    $node = simplexml_import_dom($doc->importNode($z->expand(), true));

    //I read the node here 
    print_r($node);

    //Here I want to delete it
    //////////////////////////

    //move to next node
    $z->next('item');
}

Я хочу удалить узел из XML-файла после его прочтения , чтобы избежать повторного чтения одних и тех же данных при повторном вызове сценария. Каков наилучший способ сделать это? Могу ли я сделать это во время чтения файла?

Я не мог найти ответ где-либо еще.

Ответы [ 2 ]

0 голосов
/ 09 ноября 2018

У XMLReader есть партнер по имени XMLWriter. Таким образом, для больших файлов XML вы читаете файл XML с помощью XMLReader, а записываете отфильтрованные / измененные данные с использованием XMLWriter в новый файл.

Расширение части файла в DOM позволяет легче читать и модифицировать эту часть, но вам нужно будет использовать XMLWriter для сериализации структуры XML в новый файл.

Я реализовал функции (включая collapse() метод) для этого в FluentDOM . Вот пример использования:

$xml = <<<'XML'
<persons>
  <person><name>Alice</name></person>
  <person><name>Bob</name></person>
  <person><name>Charlie</name></person>
</persons>
XML;

// Create the target writer and add the root element
$writer = new \FluentDOM\XMLWriter();
$writer->openUri('php://stdout');
$writer->setIndent(2);
$writer->startDocument();
$writer->startElement('persons');

// load the source into a reader
$reader = new \FluentDOM\XMLReader();
$reader->open('data://text/plain;base64,'.base64_encode($xml));

// iterate the person elements - the iterator expands them into a DOM element node
foreach (new \FluentDOM\XMLReader\SiblingIterator($reader, 'person') as $person) {
  /** @var \FluentDOM\DOM\Element $person */
  // ignore "Bob"
  if ($person('string(name)') !== 'Bob') {
    // write expanded node to the output
    $writer->collapse($person);
  }
}

$writer->endElement();
$writer->endDocument();

Выход:

<?xml version="1.0"?>
<persons>
 <person>
  <name>Alice</name>
 </person>
 <person>
  <name>Charlie</name>
 </person>
</persons>
0 голосов
/ 09 ноября 2018

Вы не можете редактировать документ, читая его .. по крайней мере, без большого грязного неэффективного кода.

Лучший подход будет:

1) Читать весь документ ввторой DOMDocument объект.

2) Когда вы читаете узлы один за другим из входного потока XMLReader, найдите соответствующие узлы в DOMDocument и удалите их после завершения.Будьте осторожны, чтобы не удалять узлы, у которых есть дочерние элементы, которые вы еще не просмотрели.

3) По завершении сохраните новый DomDocument под новым именем файла и используйте его в качестве источника ввода для следующего сеанса редактирования.

Вы будете экспертом по DomDocument манипуляциям, когда закончите.

Опубликуйте новый вопрос, если у вас возникнут проблемы.

...