with open('file','r') as f:
newestXml = []
for line in f.readlines():
if re.search('^<\?xml',line):
newestXml = [line]
else:
newestXml.append(line)
В конце цикла newestXml
будет содержать все строки от последнего вхождения <?xml
до конца файла.Теперь вы можете комбинировать строки и использовать синтаксический анализатор xml для анализа xml.
Примечание. Сейчас я не могу проверить этот код, поэтому он может содержать небольшие ошибки, но я надеюсь, что идея поможет вам.