невозможно получить данные в теге HTML - PullRequest
0 голосов
/ 04 сентября 2018

не может получить данные в теге HTML "alt" =

from bs4 import BeautifulSoup
import re
soup=BeautifulSoup("""<div class="couponTable">
    <div id="tgCou1" class="tgCoupon couponRow"><span class="spBtnMinus"></span><!-- react-text: 67 -->Wednesday Matches<!-- /react-text --></div>
    <div class="cflag"><img src="/ContentServer/jcbw/images/flag_JLC.gif?CV=L302R1g" alt="Japanese League Cup" title="Japanese League Cup" class="cfJLC"></div>
    <div class="cflag"><img src="/ContentServer/jcbw/images/flag_JLC.gif?CV=L302R1g" alt="Japanese League Cup" title="Japanese League Cup" class="cfJLC"></div>
    </div></div></div>""")

lines=soup.find_all('div')
line in lines:print(re.findall('\w+',line['alt'])[0])

1 Ответ

0 голосов
/ 04 сентября 2018

Если вам нужно только значение alt, лучше получить тег img, а не div. Также нет необходимости использовать регулярные выражения для извлечения значения alt

from bs4 import BeautifulSoup
import re
soup=BeautifulSoup("""<div class="couponTable">
<div id="tgCou1" class="tgCoupon couponRow"><span class="spBtnMinus"></span><!-- react-text: 67 -->Wednesday Matches<!-- /react-text --></div>
<div class="cflag"><img src="/ContentServer/jcbw/images/flag_JLC.gif?CV=L302R1g" alt="Japanese League Cup" title="Japanese League Cup" class="cfJLC"></div>
<div class="cflag"><img src="/ContentServer/jcbw/images/flag_JLC.gif?CV=L302R1g" alt="Japanese League Cup" title="Japanese League Cup" class="cfJLC"></div>
</div></div></div>""",'html.parser')

lines=soup.find_all('img')
for line in lines:
    print(line['alt'])

выход

Кубок Лиги Японии
Кубок Лиги Японии

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...