создать подмножество файлов xmls из исходного xmls, сохраняя ту же структуру - PullRequest
0 голосов
/ 04 июля 2019

мой вопрос: я хотел бы создать подмножество файлов xmls из исходного xmls, сохраняя при этом ту же структуру.Вы можете сказать, что я хотел бы отфильтровать, чтобы иметь подмножества.

Каков наилучший способ решения такой задачи и самый эффективный способ, поскольку я имею дело с базой данных Medline!

1 Ответ

0 голосов
/ 04 июля 2019

Широкий обзор здесь.

  1. Полностью прочитайте входной XML-файл.

  2. Решите, на каком уровне вы хотите разделить XML-файлы. (например, уровень 3)

  3. Определите интересующие вас теги. Вы можете заранее выбрать теги или предоставить пользователю графический интерфейс для выбора необходимых тегов. Вы также можете разбить входной файл на множество файлов, содержащих все теги входного файла.

  4. Создать выходные файлы. например до уровня 3 файлы идентичны. На 4 уровне у вас будет много разных файлов.

например. если у вас есть XML-файл, такой как

<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
           <L4b> .... </L4b>
           <L4c> .... </L4c>
        </L3>
    </L2>
</L1>    

вы можете сделать 3 выходных файла

<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
        </L3>
    </L2>
</L1>    

<L1> .... 
    <L2> ...
        <L3> ....
           <L4b> .... </L4b>
        </L3>
    </L2>
</L1>    

и т. Д.

...