Question

У меня есть большой xml-файл (содержит около несколько миллионов записей ), и мне нужно получить около 100 записей (на основе id или что-то вродечто)

Я пробовал TinyXml и Xalan-C , но оба они используют DOM, поэтому это вызывает проблему out of memory.

Существует ли библиотека C / C ++, которая может сделать это без загрузки всех данных в память как DOM?

Jay · Answer 1 · 09 декабря 2011

Как насчет Apache Xerces?Он чертовски зрелый и оптимизирован для производительности (то есть он не будет читать ваши полные файлы в память!).

Michael Kay · Answer 2 · 09 декабря 2011

Процессор Saxon-EE XSLT может обрабатывать подмножество XSLT в потоковом режиме (то есть без построения дерева в памяти). Подробнее см.

http://www.saxonica.com/documentation/sourcedocs/streaming.xml

Это не C / C ++, но вы не говорите, является ли это жестким ограничением.

Как получить правильные данные в большом XML-файле?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить правильные данные в большом XML-файле?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы