путь к элементу с условиями на атрибуты parent (s) с использованием xpath, lxml, python - PullRequest
2 голосов
/ 19 октября 2010

Я работаю над проектом, используя lxml. вот пример xml

<PatientsTree>
  <Patient PatientID="SKU065427">    
    <Study StudyInstanceUID="25.2.9.2.1107.5.1.4.49339.30000006050107501192100000001">
      <Series SeriesInstanceUID="2.16.840.1.113669.1919.1176798690"/>
      <Series SeriesInstanceUID="2.16.840.1.113669.1919.1177084041"/>
      <Series SeriesInstanceUID="25.2.9.2.1107.5.1.4.49339.30000006050108064034300000000"/>
    </Study>    
  </Patient>
  <Patient PatientID="SKU55527">
    <Study StudyInstanceUID="25.2.9.2.1107.5.1.4.49339.30000006120407393721800000007">
      <Series SeriesInstanceUID="2.16.840.1.113669.1919.1198835144"/>
    </Study>
    <Study StudyInstanceUID="25.2.9.2.1107.5.1.4.49339.30000007010207164403100000013">
      <Series SeriesInstanceUID="2.16.840.1.113669.1919.1198835358"/>    
  </Patient>
</PatientsTree>

Предположим, я хочу получить элемент серии с условиями

  1. PatientID = "SKU55527"
  2. StudyInstanceUID = "25.2.9.2.1107.5.1.4.49339.30000007010207164403100000013";

Мой результат будет:

<Series SeriesInstanceUID="2.16.840.1.113669.1919.1198835358"/>  

Если я смогу понять это решение, тогда я подойду еще на шаг ближе к изучению XML P.S. Я работаю с python, lxml и xpath

Ответы [ 3 ]

3 голосов
/ 19 октября 2010
import lxml.etree as le
with open('data.xml') as f:
    doc=le.parse( f )
patientID="SKU55527"
studyInstanceUID="25.2.9.2.1107.5.1.4.49339.30000007010207164403100000013"
xpath='''\
    /PatientsTree
        /Patient[@PatientID="{p}"]
            /Study[@StudyInstanceUID="{s}"]
                /Series'''.format(p=patientID,s=studyInstanceUID)
seriesInstanceUID=doc.xpath(xpath)
for node in seriesInstanceUID:
    print(node.attrib)
    # {'SeriesInstanceUID': '2.16.840.1.113669.1919.1198835358'}
2 голосов
/ 19 октября 2010

Это выражение XPath:

/PatientsTree 
  /Patient[@PatientID='SKU55527']     
    /Study[@StudyInstanceUID =
           '25.2.9.2.1107.5.1.4.49339.30000007010207164403100000013'] 
      /Series 

Результаты в этом узле выбраны:

<Series SeriesInstanceUID="2.16.840.1.113669.1919.1198835358"/>  
1 голос
/ 19 октября 2010

Если вы хотите использовать lxml изначально вместо xpath: (в противном случае решение unutbu идеально)

from lxml import etree as ET
tree = ET.parse('some_file.xml')
patientID="SKU55527"
studyInstanceUID="25.2.9.2.1107.5.1.4.49339.30000007010207164403100000013"
patient_node = tree.find(patientID)
if not patient_node is None:
    study_node = patient_node.find(studyInstanceUID)
    if not study_node is None:
        for child in study_node.getchildren():
            print child.attrib
            #or do whatever useful thing you want
    else:
        #didn't find the study
else:
    #didn't find the node
...