Как улучшить производительность XML для DataFrame? - PullRequest
0 голосов
/ 31 мая 2019

У меня есть следующий пример, я анализирую с xml на DataFrame, но это занимает много времени, когда файл очень большой.

def xml2df(filename):
    cols = ["title", "request_number"]
    df = pd.DataFrame(columns=cols)

    with open(filename, 'r') as file:
        tree = ET.parse(file)
        root = tree.getroot()
        for node in root:
            title = node.find("title").text
            request_number = node.find("pro/rn").text
            df = df.append(pd.Series([title, request_number], index=cols))
    return df.head()


xml2df("file.xml")

Есть идеи о том, как улучшить производительность?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...