Я анализирую xml-файл с помощью Beautiful Soup, но обнаружил противоречивое поведение при разборе пустых элементов. * 1001 Т.е. *
from BeautifulSoup import BeautifulSoup
s1 = "<c><a /><b /></c>"
s2 = "<c><a></a><b></b></c>"
soup1 = BeautifulSoup(s1)
soup2 = BeautifulSoup(s2)
print soup1
# <c><a><b></b></a></c>
print soup2
# <c><a></a><b></b></c>
Обратите внимание, что тег b
находится внутри тега a
в первом случае, но не во втором. Я думал, что спецификация XML означает, что s1
и s2
эквивалентны?
Есть мысли о том, как я могу справиться с этим?