Структура файла
У меня есть папка с именем test_folder , в которой есть несколько подпапок (названных разными фруктами, как вы увидите в моем коде ниже) внутри,В каждой подпапке всегда есть файл metadump.xml , из которого я извлекаю информацию.
Текущая позиция
Мне удалось добиться этого наиндивидуальный базис, где я указываю путь к подпапке.
import re
in_file = open("C:/.../Downloads/test_folder/apple/metadump.xml")
contents = in_file.read()
in_file.close()
title = re.search('<dc:title rsfieldtitle="Title"
rsembeddedequiv="Name" rsfieldref="8" rsfieldtype="0">(.+?)</dc:title>',
contents).group(1)
print(title)
Следующие шаги
Я хотел бы выполнить следующую функцию в большем масштабе, просто ссылаясь на родительскую папку C: /.../ Downloads / test_folder и заставить мою программу находить xml-файл для каждой подпапки, чтобы извлечь нужную информацию, вместо того, чтобы индивидуально указывать каждую подпапку с фруктами.
Уточнение
Вместо того, чтобы просто получать список подпапок или список файлов XML в этих подпапках, я хотел бы физически получить доступ к этим подпапкам, чтобы выполнить эту функцию извлечения текста из каждого файла XML в каждой подпапке.
Заранее спасибо за помощь.