У меня есть следующий пример, я анализирую с xml на DataFrame, но это занимает много времени, когда файл очень большой.
def xml2df(filename):
cols = ["title", "request_number"]
df = pd.DataFrame(columns=cols)
with open(filename, 'r') as file:
tree = ET.parse(file)
root = tree.getroot()
for node in root:
title = node.find("title").text
request_number = node.find("pro/rn").text
df = df.append(pd.Series([title, request_number], index=cols))
return df.head()
xml2df("file.xml")
Есть идеи о том, как улучшить производительность?