Как очистить тег <h1> с помощью BeautifulSoup? [Python] - PullRequest
1 голос
/ 02 августа 2020

В настоящее время я пишу программу отслеживания цен для разных сайтов, но у меня возникла проблема. Я пытаюсь очистить содержимое тега h1 с помощью BeautifulSoup4, но не знаю как. Я пытался использовать словарь, как предложено в { ссылка }, но он вернул None. Может кто-нибудь помочь? Мы будем признательны!

Вот код:

from termcolor import colored
import requests
from bs4 import BeautifulSoup
import smtplib

def choice_bwfo():
    print(colored("You have selected Buy Whole Foods Online [BWFO]", "blue"))
    url = input(colored("\n[ 2 ] Paste a product link from BWFO.\n", "magenta"))
    url_verify = requests.get(url, headers=headers)
    soup = BeautifulSoup(url_verify.content, 'html5lib')

    item_block = BeautifulSoup.find('h1', {'itemprop' : 'name'})
    print(item_block)

choice_bwfo()

вот пример URL, который вы можете использовать:

https://www.buywholefoodsonline.co.uk/organic-spanish-bee-pollen-250g.html

Спасибо :)

1 Ответ

1 голос
/ 02 августа 2020

Этот скрипт распечатает содержимое тега <h1>:

import requests
from bs4 import BeautifulSoup


url = 'https://www.buywholefoodsonline.co.uk/organic-spanish-bee-pollen-250g.html'

# create `soup` variable from the URL:
soup = BeautifulSoup(requests.get(url).content, 'html.parser')

# print text of first `<h1>` tag:
print(soup.h1.get_text())

Печать:

Organic Spanish Bee Pollen 250g

Или вы можете сделать:

print(soup.find('h1', {'itemprop' : 'name'}).get_text())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...