парсинг огромный xml - PullRequest
       8

парсинг огромный xml

1 голос
/ 11 мая 2010

Мне нужно проанализировать большие XML-каналы (> 100 МБ) и сохранить в базе данных MySQL XML-файлы хорошо отформатированы и содержат много дочерних элементов. Я думал об использовании Java + XMLbeans и SAX для обработки и сохранения каналов XML.

Пожалуйста, предложите мне правильный подход к этому делу. Я беспокоюсь о производительности.

спасибо заранее.

Ответы [ 2 ]

0 голосов
/ 11 мая 2010

Отображение объектов XML в класс, безусловно, является наиболее простым в обслуживании и одним из разумных способов решения проблем анализа и сохранения. Я предлагаю проверить другие решения для сопоставления XML. Jibx приходит на ум, если вы ищете хорошую производительность. Пожалуйста, пройдите: эту статью , прежде чем принять решение. [ ПРЕДУПРЕЖДЕНИЕ : статья древняя (2003) и может не отражать сегодняшние версии фреймворков. Хотя вы можете использовать аналогичное сравнение, чтобы опробовать различные варианты.]

Синтаксический анализ XML Pull также является хорошим (но неясным) вариантом для очень больших файлов XML. (IMO 100 МБ не так уж велик.) Попробуйте взглянуть на XPP и XML Pull Parsing . Но это касается только анализа. Однако вы можете легко реализовать свой собственный постоянный код поверх парсера. Поддержание такого кода - другая история.

0 голосов
/ 11 мая 2010

пожалуйста, попробуйте этот URL, который поможет вам лучше ...

http://simplepie.org/
http://github.com/rmccue/simplepie/downloads
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...