Question

Это суп со страницы с подробностями поста WordPress:

content = soup.body.find('div', id=re.compile('post'))
title = content.h2.extract()
item['title'] = unicode(title.string)
item['content'] = u''.join(map(unicode, content.contents))

Я хочу опустить включающий тег div при назначении item['content']. Есть ли способ отобразить все дочерние теги тега в Unicode? Что-то вроде:

item['content'] = content.contents.__unicode__()

, которая выдаст мне одну строку в юникоде вместо списка.

Ayman Hourieh · Answer 1 · 09 мая 2009

Вы пробовали:

unicode(content)

Преобразует разметку content в одну строку Unicode.

Редактировать: если вы не хотите вмещающий тег, попробуйте:

content.renderContents()

Как визуализировать содержимое тега в юникоде в BeautifulSoup?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как визуализировать содержимое тега в юникоде в BeautifulSoup?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы