доступ к указанным c элементам в классе HTML - PullRequest
0 голосов
/ 21 июня 2020

Я хотел бы получить в содержании только название товара и его продавца. Я не хочу описания или обратной связи.

  <div class="m-l-50 col-md-7 ">
      <span class="font-size-15 " style="vertical-align:top"><strong>How to fix hdd</strong></span><br>
      <span>Seller: bestbuy</span><br>
      
      <span>Description: This Method will show you how to </span><br>
      
     Feedback:<strong> <span style="color: green;"> 74 </span> :  <span style="color: red;">1 </span><br>



МОЙ КОД

def scrape_this_page(page_source):
    page_source=BeautifulSoup(page_source,"html.parser")

    products = page_source.findAll(class_='m-l-50 col-md-7')

    for product in products:
        names.append(product.span[0])
    for product in products:
        sellers.append(product.span[1])

1 Ответ

2 голосов
/ 21 июня 2020

В селене просто используйте -> например: driver.find_element_by_css_selector(div.some_class_name.another_class_name)

А в BeautifulSoup используйте page_source.select(div.some_class_name.another_class_name)

Если у вас нет имени класса, вам нужно выполнить итерацию (для l oop ) над элементами и проверьте, начинается ли текст с "Продавца" или откройте его с помощью Indies (elements [0]) (может быть нестабильным)

...