Как записать закодированное с помощью base 64 изображение и сохранить в базе данных, используя python - PullRequest
0 голосов
/ 02 июля 2019

Я пытаюсь удалить изображения с веб-сайтов, но которые закодированы с помощью base 64. Так как я могу это сделать с помощью python, beautifulsoup.

Я попробовал код с помощью python urllib, но он не собираетсяна работу.

import urllib
import urllib.request
from bs4 import BeautifulSoup
import base64
import os
from string import ascii_lowercase

def make_soup(url):
    thepage = urllib.request.urlopen(url)
    soupdata = BeautifulSoup(thepage, "html.parser")
    return soupdata
soup = make_soup("https://mahabhunakasha.mahabhumi.gov.in/bhunaksha/27/index.jsp")
soups = soup.decode('utf-8')

print(soups)
# for img in soup.findAll("src"):
#     print(img)

Я хочу скачать, что все изображения из всех областей и хранить в базе данных Монго.

1 Ответ

0 голосов
/ 02 июля 2019

Чтобы избежать ошибки SSL, которую я использовал селен, вы можете загрузить Firefox exe и передать путь к исполняемому файлу, после чего вы сможете очистить страницу после установки модуля селен со следующим:

#!pip install selenium

from bs4 import BeautifulSoup
from selenium import webdriver

driver = webdriver.Firefox(executable_path = 'C:\Gecko\geckodriver.exe')
thepage = driver.get("https://mahabhunakasha.mahabhumi.gov.in/bhunaksha/27/index.jsp")
html = driver.page_source
soup = BeautifulSoup(html,'lxml')

Я не видел изображений на этой странице, похоже, это класс canvas.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...