Поиск подходящего текста - PullRequest
0 голосов
/ 16 февраля 2020
   <div class="product-name">
                        CLR2811
                    </div>

Я хочу удалить это название продукта. Мой код:

ProductTitle = page_soup.find("div",attrs = {'class':'product-name'})

Это, вероятно, должно вернуть мне правильные вещи, например, CLR2811, но когда я печатаю ProductTitle, он возвращает меня.

<div class="product-name">

                        </div>

Просто отсутствует имя URL = http://www.coolline-group.com/product-details.php?pid=5a3c8ac755d2f

1 Ответ

4 голосов
/ 16 февраля 2020

Как указали @ AlexDotis , вам необходимо использовать атрибут текста элемента:

from bs4 import BeautifulSoup
import requests

headers = requests.utils.default_headers()
headers.update({ 'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0'})
url = "http://www.coolline-group.com/product-details.php?pid=5a3c8ac755d2f"
req = requests.get(url, headers)
soup = BeautifulSoup(req.content, 'html.parser')

name = soup.find("div",attrs = {'class':'product-name'})
print (name.text.strip())

Вывод:

CLR2811
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...