Производительность анализа VTD-XML (критический фактор скорости). Запрос отзывов / комментариев - PullRequest
3 голосов
/ 26 марта 2010

Я собираюсь использовать VTD-XML (находится по адресу http://vtd -xml.sourceforge.net / ), но я заинтересован в получении отзывов об использовании в реальном случае любым, кто использовал Библиотека и есть какие-либо комментарии.

По URL (http://vtd -xml.sourceforge.net / ) есть тесты, но если кто-то использовал VTD-XML и у него есть комментарии для него, я бы хотел их услышать. Скорость - критический фактор в приложении, и я ищу разработчиков после комментариев в реальном случае.

С уважением,

Ответы [ 3 ]

8 голосов
/ 13 августа 2010

Я использую VTD-XML для более быстрых XPath. Ранее мое приложение использовало DOM для применения XPath к документу, что занимало около 20 минут на документе размером 17 МБ. Я думал о переходе на SAX, но SAX не поддерживает XPath, довольно «недружественный» для пользователя и потребовал бы много реструктуризации кода. Таким образом, я безболезненно перешел на VTD-XML, и моя обработка XML теперь занимает около 20 секунд!

4 голосов
/ 26 марта 2010

Производительность VTD-XML измеряется несколькими источниками, ниже приведены некоторые из них

  1. Этот отчет (https://code.ai.techfak.uni -bielefeld.de / trac / xcf / wiki / Evaluation ) содержит числа, которые измеряют производительность синтаксического анализа / xpath по сравнению с XOM, двоичным XML, SAX и DOM

  2. Кроме того, xmlbench (поиск по сети в качестве ключевого слова) приведет вас к проекту с открытым исходным кодом, посвященному производительности сайта синтаксического анализа XML

  3. На веб-сайте VTD-XML также есть ряд сравнительных отчетов (скоро будут обновления).

    1. вот статья некоторых исследователей из Португалии, опубликованная в 2013 году. http://sdiwc.net/digital-library/web-admin/upload-pdf/00000466.pdf
1 голос
/ 15 марта 2011

Я обнаружил, что VTD-XML действительно быстрее разбирается и XPAth, однако я обнаружил, что он использует намного больше памяти для XPath, чем DOM. Кроме того, версия Java 2.10 просто не работала с атрибутами и XPath, так что это было просто невозможно.

...