Я создаю Python веб-скребок, который просматривает страницу результатов поиска eBay (в данном случае «Игровые ноутбуки») и собирает название каждого предмета для продажи. Я использую BeautifulSoup, чтобы сначала получить тег h1, в котором хранится каждый заголовок, а затем распечатать его в виде текста:
for item_name in soup.findAll('h1', {'class': 'it-ttl'}):
print(item_name.text)
Однако внутри каждого тега h1 с классом it-ttl также является тегом span, который содержит некоторый текст:
<h1 class="it-ttl" itemprop="name" id="itemTitle">
<span class="g-hdn">Details about </span>
Acer - Nitro 5 15.6" Gaming Laptop - Intel Core i5 - 8GB Memory - NVIDIA GeFo…
</h1>
Моя текущая программа распечатывает содержимое тега span AND заголовок элемента: Вывод моей консоли
Может ли кто-нибудь объяснить мне, как получить просто заголовок элемента, игнорируя тег span, содержащий текст «Подробности о»? Спасибо!