У меня есть этот блок XML:
<bpmn:scriptTask id="UserTask_0qtrxsq" name="set variables app_from_user & applist to "ticketingsystem"" scriptFormat="groovy">
... <bpmn:script> What should be matched is here ... </bpmn:script>
</bpmn:scriptTask>
в файле XML, который я пытаюсь проанализировать с помощью Python и XPath.Ниже приведена строка, которая должна соответствовать тегу script:
getLines = xml.xpath('//*[local-name()="scriptTask"][@name="%s"]/*[local-name()="script"]/text()' % script_name)
, где script_name
должно быть set variables app_from_user & applist to "ticketingsystem"
в одной из итераций по всем существующим тегам scriptTask в файле XML.
Он отлично работает для всех других тегов, но не для этого.Когда я удалил сущности HTML (местозаполнители для амперсандов, кавычек и т. Д., Он работал нормально:
<bpmn:scriptTask id="UserTask_0qtrxsq" name="set variables app_from_user" scriptFormat="groovy">
... <bpmn:script> What should be matched is here ... </bpmn:script>
</bpmn:scriptTask>
Но я не имею контроля над файлами XML, и я хочу, чтобы скрипт был таким же общим, какМожно ли сделать запрос XPath для извлечения содержимого тега script
без ошибок?