Я хочу проанализировать данные из XML-файла в мультииндексном фрейме данных pandas. Мой XML-файл выглядит так:
<?xml version="1.0"?>
<catalog>
<book name="Documents/Books/German">
<author>Kerstin Gier</author>
<title>Rubinrot</title>
</book>
<book name="Documents/Articles/English">
<author>Kim Ralls</author>
<title>Midnight Rain</title>
</book>
<book name="Documents/Books/English">
<author>Eva Corets</author>
<title>Maeve Ascendant</title>
</book>
<book name="Documents/Books/English">
<author>Karl Parker</author>
<title>Worldeater</title>
</book>
</catalog>
Цель состоит в том, чтобы сохранить данные из всех тегов книги в мультииндексном панде, который должен выглядеть следующим образом:
author title
Documents Books German Kerstin Gier Rubinrot
English Eva Corets Maeve Ascendant
Karl Parker Worldeater
Articles German Null Null
English Kim Ralls Midnight Rain
Индексом мультииндексного фрейма данных должны быть пути, которые содержит атрибут «имя». Я не хочу жестко кодировать какие-либо пути, потому что в моем примере из реального мира много разных путей, а мультииндексный фрейм данных будет иметь 5-6 измерений.
Мой подход пока:
Я начал создавать единый индексный фрейм данных, который выглядит так
path author title
Documents/Books/German Kerstin Gier Rubinrot
Documents/Articles/English Kim Ralls Midnight Rain
Documents/Books/English Eva Corets Maeve Ascendant
Documents/Books/English Karl Parker Worldeater
Вопрос: как я могу преобразовать фрейм данных в мультииндексный фрейм данных со структурой пути в виде индексов? Проблема, которую я вижу, заключается в изменении индексов без потери привязки к данным.