Question

Я хочу не только содержимое страницы, но и форматирование, связанное с каждым заголовком в моем итоговом документе, а не просто текст без выделения заголовков. например форматирование всех заголовков жирным шрифтом.

На данный момент я извлекаю только текст моего содержимого div, объединяющий все заголовки и абзацы:

soup = BeautifulSoup(page.content, 'html.parser')


t=soup.find_all('div',class_=['x'])

    df=[]
    for i in t:
        for head in i:
            df.append(i.get_text())

Теперь мне нужно, чтобы текст был извлечен из заголовка, а затем из следующего абзаца, чтобы я мог отформатировать заголовки. Так что я бы перебрал все заголовки, извлек заголовок и затем текст абзаца ....

Красивый суп - извлеките все заголовки, параграфы впоследствии

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Красивый суп - извлеките все заголовки, параграфы впоследствии

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов