Question

У меня есть следующий пример, я анализирую с xml на DataFrame, но это занимает много времени, когда файл очень большой.

def xml2df(filename):
    cols = ["title", "request_number"]
    df = pd.DataFrame(columns=cols)

    with open(filename, 'r') as file:
        tree = ET.parse(file)
        root = tree.getroot()
        for node in root:
            title = node.find("title").text
            request_number = node.find("pro/rn").text
            df = df.append(pd.Series([title, request_number], index=cols))
    return df.head()


xml2df("file.xml")

Есть идеи о том, как улучшить производительность?

Как улучшить производительность XML для DataFrame?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как улучшить производительность XML для DataFrame?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов