Img соскоб с использованием BS4 и селена - PullRequest
0 голосов
/ 29 мая 2018

Я пытаюсь очистить некоторые IMG-файлы от IG, используя селен и bs4.У меня есть следующий скрипт для этого, кажется, он работает нормально, но в итоге я бы хотел, чтобы он просто напечатал img src, образец: https://scontent-lax3-2.cdninstagram.com/vp/2592f6b07f88bfc4bfdf6d73400a04b8/5BA6E998/t51.2885-15/s640x640/sh0.08/e35/28752330_1972627949433283_1816022201220988928_n.jpg и загрузил изображения позже.Но сейчас мне нужна помощь, чтобы просто напечатать эту ссылку img src без тегов и дополнений.Спасибо за совет.

Код:

import requests
from bs4 import BeautifulSoup
import selenium.webdriver as webdriver

url = ('https://www.instagram.com/kitties/')
driver = webdriver.Firefox()
driver.get(url)

soup = BeautifulSoup(driver.page_source, 'lxml')

img_url = soup.find_all('img', class_='_2di5p')

print img_url

1 Ответ

0 голосов
/ 29 мая 2018

Просто распечатайте src найденных изображений.

imgs= soup.find_all('img', class_='_2di5p')
for img in imgs:
    img_url=img["src"]
    print img_url
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...