Разбор больших RSS-каналов с использованием Rome, не хватает памяти - PullRequest
0 голосов
/ 13 июля 2010

В частности, большие веб-страницы XML (RSS-каналы). Я использую превосходную римскую библиотеку для их анализа, но страница, которую я сейчас пытаюсь получить, действительно большая, и Java не хватает памяти до получения всего документа.

Как я могу разделить веб-страницу, чтобы я мог передать ее в XMLReader? Должен ли я сделать это сам и передать каналы по частям после добавления своего собственного XML, чтобы начать и завершить их?

1 Ответ

0 голосов
/ 13 июля 2010

Прежде всего научитесь устанавливать параметры командной строки java для Xms и Xmx на соответствующие значения, все парсеры на основе DOM каждый дерьмо загружают память.Второй взгляд на использование Pull Parser: ему не придется загружать весь XML в документ перед его обработкой.

...