Как мне проанализировать очень большой файл XML в RStudio Server? - PullRequest
0 голосов
/ 04 июля 2019

У меня большой XML-файл из Статистического управления Канады (~ 35 ГБ), который я пытаюсь проанализировать в RStudio Server и превратить в один или несколько фреймов данных.

Я загрузил файл в свою папку на сервере. До сих пор я пытался использовать функцию xmlParse из XML, от которой я отказался примерно через 2 часа; и функция read_xml из xml2, которая вызвала сбой RStudio. Существует пакет под названием rsdmx, который может анализировать файл в формате SDMX, но, к сожалению, Статистическое управление Канады не является одним из поддерживаемых поставщиков данных.

Я предполагаю, что файл слишком велик для правильной работы этих функций анализа. Есть ли какое-то решение этого? Нужно ли выполнять анализ за пределами RStudio и впоследствии импортировать результаты?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...