Я хочу получить ссылку на изображение внутри тега описания RSS-канала.
Используя feedparser, мы получили значения в теге описания. Но я хочу получить ссылку на изображение внутри этого тега.
<description><![CDATA[<div class="K2FeedImage"><img src="https://srilankamirror.com/media/k2/items/cache/25a3bb259efa21fc96901ad625f3a85d_S.jpg" alt="MP Piyasena sentenced to 4 years in prison" /></div><div class="K2FeedIntroText"><p>Former Tamil National Alliance (TNA) parliamentarian, P. Piyasena has been sentenced to 4 years in prison and fined Rs.</p>
</div><div class="K2FeedFullText">
<p>5.4 million for using state-owned vehicle for an year after losing his parliamentary seat.</p></div>]]></description>
Затем я попытался использовать его подстроку в python.
import re
text = "<![CDATA[<img src='https://adaderanaenglish.s3.amazonaws.com/' width='60' align='left' hspace='5'/>Former Tamil National Alliance (TNA) MP P. Piyasena had been sentenced to 4 years in prison over a case of misusing a state vehicle after losing his MP post. MORE..]]>"
match = re.search("<img src=\"(.+?) \"", text, flags=re.IGNORECASE)
try:
result = match.group(1)
except:
result = "no match found"
print(result)
C: /Users/ASUS/Desktop/untitled/a.py
совпадений не найдено
Процесс завершен с кодом выхода 0