Я хочу получить все <a href=''>
, содержащие изображение (jpg, png, jpeg)
Сначала я обнаружил, что могу загружать ссылки с этим кодом Beautifulsoup
for a in soup.find_all('a', href=True):
print "Found the URL:", a['href']
НоЯ получаю все строки, которые я хочу получать только изображения.
from bs4 import BeautifulSoup
import requests
import re
url = requests.get("https://8ch.net/a/res/869528.html")
soup = BeautifulSoup(url.text,"html.parser")
print soup
for a in soup.find_all(re.compile('([-\w]+\.(?:jpg|jpeg|png))') ):#'a', href=True):
print "Found the URL:", a #['href']
после этого я обнаружил, что могу использовать выражение регулярного выражения, чтобы найти все ссылки, содержащие ссылку.
Что я делаюнеправильно?