Сохранить изображение с селеном? - PullRequest
0 голосов
/ 19 сентября 2019

это источник, который я хочу скачать:

<div id="image-captcha-section" class="a-section a-spacing-large">
  <input type="hidden" name="use_image_captcha" value="true" id="use_image_captcha">
  <div class="a-section a-spacing-base">
    <h4>
      Enter the characters you see
    </h4>

<div id="auth-captcha-image-container" class="a-section a-text-center">
  <img alt="Visual CAPTCHA image, continue down for an audio option." src="https://opfcaptcha-prod.s3.amazonaws.com/b2ebf54f0e9e48ca8e4e8552974565c1.jpg?AWSAccessKeyId=AKIA5WBBRBBB3EQNKAH5&amp;Expires=1568911776&amp;Signature=BQzylyeOezMXtuLXgnfY3IX0CdA%3D" data-refresh-url="/ap/captcha?appAction=REGISTER&amp;captchaObfuscationLevel=ape%3AZWFzeQ%3D%3D&amp;captchaType=image&amp;marketPlaceId=A1EVAM02EL8SFB" id="auth-captcha-image">
</div>

и это мой код:

                    img = driver.find_element_by_xpath('//div[@id="auth-captcha-image"]')
                    src = img.get_attribute('src')
                    # download the image
                    urllib.urlretrieve(src, "captcha.jpg")
                    print("Done")

Я искал в другой теме, но не могу сохранить это изображение, есть URL:https://opfcaptcha -prod.s3.amazonaws.com / b2ebf54f0e9e48ca8e4e8552974565c1.jpg

спасибо за помощь!

Ответы [ 3 ]

1 голос
/ 19 сентября 2019

Попробуйте это Альтернатива urllib.urlretrieve в Python 3.5 Если вы используете Python 3.5 и выше, возможно, это правильный подход

1 голос
/ 19 сентября 2019

Имя тега, которое вы выбрали, это div, но это тег img. Так что измените ваш xpath, чтобы найти элемент.

img = driver.find_element_by_xpath('//img[@id="auth-captcha-image"]')
src = img.get_attribute('src')
0 голосов
/ 19 сентября 2019

Филипп.Я не смог найти ссылку, которую вы указали, и сообщение об ошибке «Отказано в доступе».

Я думаю, что ваш код не может получить доступ и к этой ссылке.Вы можете попытаться загрузить изображение с куки при инициализации скрипта.

...