Это суп со страницы с подробностями поста WordPress:
content = soup.body.find('div', id=re.compile('post'))
title = content.h2.extract()
item['title'] = unicode(title.string)
item['content'] = u''.join(map(unicode, content.contents))
Я хочу опустить включающий тег div
при назначении item['content']
. Есть ли способ отобразить все дочерние теги тега в Unicode? Что-то вроде:
item['content'] = content.contents.__unicode__()
, которая выдаст мне одну строку в юникоде вместо списка.