Просто сделай _divTag.contents[2]
.
Возможно, ваше форматирование вводило вас в заблуждение - этот текст не относится к самому внутреннему тегу div (как покажет innerdiv.text
, innerdiv.contents
или innerdiv.findChildren()
).
Это прояснит ситуацию, если вы отступите от своего исходного XML:
<div id=storytextp class=storytextp align=center style='padding:10px;'>
<div id=storytext class=storytext>
<div class='a2a_kit a2a_default_style' style='float:right;margin-left:10px;border:none;'>
..... extra stuff
</div> **Main Content**
</div>
</div>
(PS: Мне не ясно, каково было намерение вашего innerdiv.contents[0].replaceWith("")
? Подавить атрибуты? Новые строки? В любом случае, философия BS состоит не в том, чтобы редактировать дерево разбора, а просто игнорировать 99,9%, которые вас это не волнует. Документация BS здесь ).