Разбор, обработка и использование очень больших файлов XML - PullRequest
1 голос
/ 05 августа 2010

Я хотел бы создать программу, которая генерирует контент из очень больших файлов XML размером более 500 МБ. Мне нужно получать данные из файлов в разное время, но пользователь готов немного подождать, и все это делается на локальной машине.

Я удивлялся, если у кого-нибудь был совет относительно:

Языки реализации Достаточно ли x path для легких запросов к (предположительно огромной) базе данных Любой другой совет

Мне, вероятно, нужно использовать только менее 1% данных, и я не могу ожидать, что выполню обработку заранее, чтобы подготовить файл.

Есть советы?

В ответ на комментарий: я могу разбить файл, но только прочитав его и записав снова. Так что не совсем, по сути. Я использую файл только один раз, чтобы сгенерировать этот «контент», используя выбранные (и недетерминированно выбранные) записи в данном XML-файле. Тогда мне больше никогда не понадобится этот файл.

1 Ответ

1 голос
/ 05 августа 2010

Я видел эту ссылку в stackoverflow, которая в некоторой степени связана с этим

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...