<root>
<article>
<front>
<body>
<back>
<sec id="sec7" sec-type="funding">
<title>Funding</title>
<p>This work was supported by the NIH</p>
</sec>
</back>
У меня есть XML-файл метаданных научного журнала, и я пытаюсь извлечь только информацию о финансировании для каждой статьи. Мне нужна информация, содержащаяся в теге p
. В то время как «sec id» варьируется в зависимости от статьи, «sec-type» всегда означает «финансирование».
Я пытался сделать это в Python3, используя Element Tree.
import xml.etree.ElementTree as ET
tree = ET.parse(journals.xml)
root = tree.getroot()
for title in root.iter("title"):
ET.dump(title)
Любая помощь будет принята с благодарностью!