Просто пробую свои силы в Python и надеюсь, что вы поможете мне здесь.
Я извлекаю конкретную c новость из новостей Google с помощью запросов. Мне удалось получить и прочитать все содержимое, кроме изображений.
Img sr c с URL-адресом возвращает нормально, но сталкивается с проблемой sr c, у которого есть строка base64
. ('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD...')
.
Исходная длина элемента - 3131, но мой код печатает только 82 символа. Примерно так (src="data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw=="/>)
так
- Есть ли у запросов ограничение на размер URL-адреса? Как я могу напечатать полную строку base64 в коде.
- Есть ли способ получить URL-адрес изображения из строки base64
r1 = requests.get(news_url, headers = headers, timeout = 10)
print(r1.status_code)
coverpage = r1.content
soup1 = BeautifulSoup(coverpage, 'html5lib')
class_g = soup1.find_all('div', attrs={'class': 'g'})
news_itm = []
for news in class_g:
news_itm.append(news)
news_frm_google =[]
for news_det in news_itm:
news_img = news_det.find('img').attrs['src']
Спасибо.