Парсинг с помощью Beautifulsoup, извлечение текста - PullRequest
1 голос
/ 27 мая 2020

Я пытаюсь извлечь «75» из строки ниже.

<td class="srpTuple__midGrid title_semiBold srpTuple__spacer16 " id="srp_tuple_price">₹ 75

Я пытаюсь извлечь «75». Кто-нибудь может помочь? :)

Ответы [ 2 ]

0 голосов
/ 28 мая 2020

Вы можете попробовать, чтобы узнать цену ₹ 75:
Для одного элемента td:

html_doc = """<td class="srpTuple__midGrid title_semiBold srpTuple__spacer16 " id="srp_tuple_price">₹ 75</td"""

soup = BeautifulSoup(html_doc, 'lxml')

price = price = soup.find('td', id="srp_tuple_price").text

print(price)

Для нескольких элементов td элемента:

html_doc = """<td class="srpTuple__midGrid title_semiBold srpTuple__spacer16 " id="srp_tuple_price">₹ 75</td"""

soup = BeautifulSoup(html_doc, 'lxml')

prices = soup.find_all('td', id="srp_tuple_price")

for price in prices:
    print(price.text)

0 голосов
/ 27 мая 2020

Это извлечет значение и сравнит его с переменной,

srp_tuple_price = '₹ 75'
html = '<td class="srpTuple__midGrid title_semiBold srpTuple__spacer16 " id="srp_tuple_price">₹ 75</td>'
soup = BeautifulSoup(html,features='html.parser')

rows=soup.findAll('td')
for row in rows: 
    if row.text==srp_tuple_price:
        print('Success')
    else:
        print ('fail')

Результат: Успех

...