У меня есть XML-документ, который находится в преобразованном до или после FO состоянии, из которого мне нужно извлечь некоторую информацию. В предварительном случае мне нужно вытащить два тега, которые представляют pageWidth и pageHeight, а в последнем случае мне нужно извлечь параметры page-height и page-width из определенного тега (я забыл, какой это из верх моей головы).
То, что я ищу, - это эффективный / легко обслуживаемый способ получить эти два элемента. Я хотел бы прочитать документ только один раз, выбирая две вещи, которые мне нужны.
Сначала я начал писать что-то, что будет использовать BufferedReader
+ FileReader
, но потом я занимаюсь поиском строк, и это мешает, когда теги занимают несколько строк. Затем я посмотрел на DOMParser
, который, кажется, был бы идеальным, но я не хочу читать весь файл в память, если бы мог помочь, поскольку файлы потенциально могут быть большими, а теги - поиск почти всегда будет близко к началу файла. Затем я посмотрел на SAXParser
, но это похоже на большую кучу сложного перебора для того, чего я пытаюсь достичь.
У кого-нибудь есть совет? Или простые реализации, которые достигли бы моей цели? Спасибо.
Редактировать: я забыл упомянуть, что из-за различных ограничений, которые я использую, все, что я использую, должно быть "встроено" в ядро Java, в котором я не могу использовать и / или загружать какие-либо сторонние инструменты XML.