Получите значение вне класса с помощью lxml - PullRequest
0 голосов
/ 16 июня 2020

Я работаю над программой для удаления некоторой информации с eBay. Как я могу извлечь значение из класса на eBay?

Я использую lxml для первых двух идентификаторов, а get_element_by_id отлично работает для этих 2. Третий другой, HTML -код на картинке.

Если я использую find_class, он находит фактический класс, который мне нужен, но мне нужно значение из этого класса ...

URL-адрес I ' m в примере: https://www.ebay.com/itm/153616213151

Код, который я использую для очистки:

if url.startswith('https://www.ebay.'):
    id = 'prcIsum'
    id2 = 'itemTitle'
    id3 = 'mbg-mw'

    try:
        price = html_tree.get_element_by_id(id)
        priceTag = price.text_content()
        print(priceTag)
    except:
        priceTag = "No price available"
        print(priceTag)

    try:
        item = html_tree.get_element_by_id(id2)
        itemTag = item.text_content()
        print(itemTag)

    except:
        itemTag = "No title available"
        print('no id2 found')

    try:
        seller = html_tree.find_class('mbg-nw')
        print(seller)


    except:
        SellerTag = "No seller available"
        print('no id3 found')

HTML -код

...