Я использую библиотеку lxml в python 3.5 для разбора файла xml. Содержимое XML:
xml_content = """
<wps:ExecuteResponse xmlns:gml="http://www.opengis.net/gml"
xmlns:ows="http://www.opengis.net/ows/1.1"
xmlns:wps="http://www.opengis.net/wps/1.0.0"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.opengis.net/wps/1.0.0
http://schemas.opengis.net/wps/1.0.0/wpsExecute_response.xsd"
service="WPS" version="1.0.0" xml:lang="en-US"
serviceInstance="http://192.168.2.72:5000/wps?service=WPS&request=GetCapabilities" statusLocation="http://192.168.2.72:5000/output/9fbbf322-496d-11e8-9a87-0242ac110002.xml">
<wps:Process wps:processVersion="None">
<ows:Identifier>run_checks</ows:Identifier>
<ows:Title>Run checks process</ows:Title>
<ows:Abstract>Process performing qc tool checks.</ows:Abstract>
</wps:Process>
<wps:Status creationTime="2018-04-26T16:19:41Z">
<wps:ProcessSucceeded>PyWPS Process Run checks process finished</wps:ProcessSucceeded>
</wps:Status>
<wps:DataInputs>
<wps:Input>
<ows:Identifier>filepath</ows:Identifier>
<ows:Title>Local filesystem path to the product to be checked.</ows:Title>
<wps:Data>
<wps:LiteralData dataType="string">/mnt/bubu/bebe</wps:LiteralData>
</wps:Data>
</wps:Input>
<wps:Input>
<ows:Identifier>product_type_name</ows:Identifier>
<ows:Title>The type of the product denoting group of checks to be performed.</ows:Title>
<wps:Data>
<wps:LiteralData dataType="string">dummy</wps:LiteralData>
</wps:Data>
</wps:Input>
<wps:Input>
<ows:Identifier>optional_check_idents</ows:Identifier>
<ows:Title>Comma separated identifiers of optional checks to be performed.</ows:Title>
<wps:Data>
<wps:LiteralData dataType="string">dummy</wps:LiteralData>
</wps:Data>
</wps:Input>
</wps:DataInputs>
<wps:OutputDefinitions>
<wps:Output>
<ows:Identifier>result</ows:Identifier>
<ows:Title>Result of passed checks in json format.</ows:Title>
</wps:Output>
</wps:OutputDefinitions>
<wps:ProcessOutputs>
<wps:Output>
<ows:Identifier>result</ows:Identifier>
<ows:Title>Result of passed checks in json format.</ows:Title>
<wps:Data>
<wps:LiteralData dataType="urn:ogc:def:dataType:OGC:1.1:string"> {"dummy": {"status": "ok", "message": "Dummy check has passed.", "params": "{'dummy_param1': 'dummy value1', 'dummy_param2': 'dummy value2'}"}}
</wps:LiteralData>
</wps:Data>
</wps:Output>
</wps:ProcessOutputs>
</wps:ExecuteResponse>
"""
Мой код Python для разбора файла:
from lxml import etree
ns = {'wps': 'http://www.opengis.net/wps/1.0.0',
'ows': 'http://schemas.opengis.net/ows/1.1.0'}
tree = etree.fromstring(xml_content)
# this works, the wps:Process tag is found successfully
wps_process_tag = tree.xpath('//wps:Process', namespaces=ns)
if len(wps_process_tag) > 0:
print('wps:Process tag found!')
# this does not work and the ows:Identifier tag is not found
ows_identifier_tag = tree.xpath('//wps:Process/ows:Identifier', namespaces=ns)
if len(ows_identifier_tag) > 0:
print('ows:Identifier tag found!')
else:
print('ows:Identifier tag not found!')
Как показано в моем примере кода, тег wps:Process
найден правильно. С другой стороны, тег ows:Identifier
не найден, хотя он существует прямо под wps:Process
в документе xml. Я предоставил словарь пространств имен для функции tree.xpath, чтобы найти элементы из пространств имен wps и ows. Но он находит только элементы, начинающиеся с wps:
, и не может найти элементы, начинающиеся с ows:
Я проверил URL http://schemas.opengis.net/ows/1.1.0/, и, похоже, это действительный URL.
Как найти элемент ows:Identifier
с помощью lxml?