Я редактирую оригинальный пост здесь, чтобы уточнить, и, надеюсь, я свел его к чему-то более управляемому.У меня есть строка XML, которая выглядит примерно так:
<foo id="foo">
<row>
<img alt="jules.png" src="http://localhost/jules.png" height="1024" width="764">
</row>
<row>
<img alt="hairfire.png" src="http://localhost/hairfire.png" height="225" width="225">
</row>
</foo>
Итак, я делаю что-то вроде:
xml = BeautifulStoneSoup(someXml, selfClosingTags=['img'], convertEntities=BeautifulSoup.HTML_ENTITIES)
В результате это выглядит примерно так:1008 *
Обратите внимание, что в каждом теге img нет закрывающих тегов.Не уверен, что это моя проблема, но возможно.Когда я пытаюсь сделать:
images = xml.findAll('img')
, это приводит к пустому списку.Есть идеи, почему BeautifulStoneSoup не может найти мои изображения в этом фрагменте XML?