У меня есть следующий тип XML-файла со свободным текстом (пунктами). Как я могу получить этот свободный текст, как (,), .In: которые находятся между тегами?
<bibl>
<author>Gooday GW</author>
(
<date>1994</date>
)
<title level="a">Physiology of microbial degradation of chitin and chitosan</title>
. In:
<title level="m">Biochemistry of microbial degradation</title>
.
<publisher>Springer</publisher>
,
<pubPlace>Dordrecht</pubPlace>,
pp <biblScope unit="page">279–312</biblScope>
</bibl>
Сейчас я могу получить доступ к данным с тегами, используя следующий код:
mydoc = minidom.parse('./473_book.xml')
bibls = mydoc.getElementsByTagName('bibl')
for bibl in bibls:
author = bibl.getElementsByTagName('author')
date=bibl.getElementsByTagName('date')
....