читать xml порциями и отправлять в парсинг по очереди - PullRequest
0 голосов
/ 23 апреля 2019

У меня есть требование прочитать большой xml (~ 1 ГБ) порциями правильно сформированного xml и затем отправить его в очередь промежуточного программного обеспечения, где он будет детально проанализирован и обработан параллельно. Это как читать и отправлять на разбор.

Каков наилучший способ сделать это? Это можно сделать с помощью простого буферизированного ридера или мы должны использовать stax parser

Пример ввода:

<?xml version="1.0"?>  
<PurchaseOrders>  
  <PurchaseOrder PurchaseOrderNumber="99503" OrderDate="1999-10-20">  
    <Address Type="Shipping">  
      <Name>Ellen Adams</Name>  
      <Street>123 Maple Street</Street>
    </Address>  
    <Address Type="Billing">  
      <Name>Tai Yee</Name>  
      <Street>8 Oak Avenue</Street>
    </Address>  
    <DeliveryNotes>Please leave packages in shed by driveway.</DeliveryNotes>   
  </PurchaseOrder>  
  <PurchaseOrder PurchaseOrderNumber="99505" OrderDate="1999-10-22">  
    <Address Type="Shipping">  
      <Name>Cristian Osorio</Name>  
      <Street>456 Main Street</Street>
    </Address>  
    <Address Type="Billing">  
      <Name>Cristian Osorio</Name>  
      <Street>456 Main Street</Street>
    </Address>  
    <DeliveryNotes>Please notify me before shipping.</DeliveryNotes>   
  </PurchaseOrder>  
  <PurchaseOrder PurchaseOrderNumber="99504" OrderDate="1999-10-22">  
    <Address Type="Shipping">  
      <Name>Jessica Arnold</Name>  
      <Street>4055 Madison Ave</Street>  
    </Address>  
    <Address Type="Billing">  
      <Name>Jessica Arnold</Name>  
      <Street>4055 Madison Ave</Street>  
    </Address>  
  </PurchaseOrder>  
....
....
</PurchaseOrders>  

Вывод: группа заказов на покупку (100 одновременно) и отправка ее в очередь для анализа на уровне поля

...