Как узнать между предложениями, например, это заголовок статьи, а это номер телефона. ТАК найти систему, которая дает имена тегов, используя python.
Это xml:
<?xml version="1.0"?>
-<journal>
-<front>
<num italic="no" bold="yes">Surviving, Being Resilient and Resisting: Teachers’ Experiences in Adverse Times </num>
-<author-group italic="no" bold="yes">
<b>Maria Assunção Flores</b>
</author-group>
-<num italic="no" bold="yes">
<b>Associate Professor with Qualification</b>
</num>
-<aff italic="no" bold="yes">
<b>University of Minho</b>
</aff>
-<aff italic="no" bold="yes">
<b>Institute of Education</b>
</aff>
-<author-group italic="no" bold="yes">
<b>Campus de Gualtar</b>
</author-group>
-<author-tobe italic="no" bold="yes">
<b>4710-057 Braga</b>
</author-tobe>
-<num italic="no" bold="yes">
<b>Portugal</b>
</num>
-<num italic="no" bold="yes">
<b>Phone: +351 253 604606</b>
</num>
-<num italic="no" bold="yes">
<b>Fax: + 351 253 678987</b>
</num>
-<corresp italic="no" bold="yes">
-<url>
<b>aflores@ie.uminho.pt</b>
</url>
</corresp>