Я новичок в веб-скрейпинге с использованием bs4 и хочу получить изображение белка из банка данных белка (PDB):
https://www.rcsb.org/structure/1A69
Когда я проверяю HTML с помощью Chrome Inspector, я вижу, что изображение получено через http-ссылку, по которой я могу легко go сохранить изображение.
<img class="img-responsive center-block mainImage"
src="https://cdn.rcsb.org/images/rutgers/a6/1a69/1a69.pdb1-500.jpg">
Однако, когда Я запускаю свой скрипт для извлечения sr c, я получаю его только как base64.
data:image/gif;base64,R0lGODlhAQABAAD/ACwAAAAAAQABAAACADs=
Я что-то не так делаю? Что творится? Есть ли способ вернуть http-ссылку из base64?
Мой код:
from bs4 import BeautifulSoup as bs
from urllib.request import urlopen
url = "https://www.rcsb.org/structure/1A69"
resp = urlopen(url)
page = bs(resp,"html.parser")
for img in page.findAll('img',{'class':'img-responsive'}):
src = img['src']
print(src)