экспорт названия метки с веб-страницы с использованием Python bsObj - PullRequest
0 голосов
/ 28 февраля 2019

Я хочу получить имя цели URL с веб-страницы. Это то, что было сделано до сих пор:

check ='https://www.zap.co.il/search.aspx?keyword='+'N3580-5092'
r = requests.get(check)
html = requests.get(r.url)
bsObj = BeautifulSoup(html.content,'xml')
storeName = bsObj.select_one('div.StoresLines div.BuyButtonsTxt')

результат:

<div class="BuyButtonsTxt">
                ב-<a aria-label="לקנייה ב-פיסי אונליין Dell Inspiron 15 3580 
N3580-5092" href="/fs.aspx?pid=666473435&amp;sog=c-pclaptop" id="" 
target="_blank">פיסי אונליין</a>
</div>

я хочу толькозначение в href: "פיסי אונליין" как это сделать?

1 Ответ

0 голосов
/ 28 февраля 2019

Мне пришлось изменить bsObj = BeautifulSoup(html.content,'xml') на bsObj = BeautifulSoup(html.content,'html.parser'), так как 'xml' не нашел бы тег для меня

from bs4 import BeautifulSoup 
import requests


check ='https://www.zap.co.il/search.aspx?keyword='+'N3580-5092'
r = requests.get(check)
html = requests.get(r.url)
bsObj = BeautifulSoup(html.content,'html.parser')
storeName = bsObj.select_one('div.StoresLines div.BuyButtonsTxt')



text = storeName.find('a').text

Вывод:

'פיסי אונליין'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...