Python -Get запросы обрезают строку base64 - PullRequest
0 голосов
/ 19 июня 2020

Просто пробую свои силы в Python и надеюсь, что вы поможете мне здесь.

Я извлекаю конкретную c новость из новостей Google с помощью запросов. Мне удалось получить и прочитать все содержимое, кроме изображений.

Img sr c с URL-адресом возвращает нормально, но сталкивается с проблемой sr c, у которого есть строка base64. ('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD...').

Исходная длина элемента - 3131, но мой код печатает только 82 символа. Примерно так (src="data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw=="/>)

так

  1. Есть ли у запросов ограничение на размер URL-адреса? Как я могу напечатать полную строку base64 в коде.
  2. Есть ли способ получить URL-адрес изображения из строки base64
    r1 = requests.get(news_url, headers = headers, timeout = 10)
    print(r1.status_code)
    coverpage = r1.content
    soup1 = BeautifulSoup(coverpage, 'html5lib')
    class_g = soup1.find_all('div', attrs={'class': 'g'})
    news_itm = []
    for news in class_g:
        news_itm.append(news)
    news_frm_google =[]
    for news_det in news_itm:
        news_img = news_det.find('img').attrs['src']

Спасибо.

...