Python печатает URL с img +, переходя на новую страницу - PullRequest
0 голосов
/ 14 октября 2019

Я хочу ввести ссылку на следующую страницу в переменной в конце ссылки.

Я новичок в Python: (

Вот мой скрипт:

from urllib.request import urlopen
from bs4 import BeautifulSoup
import re

html = urlopen('https://test.com/index/index/2')
bs = BeautifulSoup(html, 'html.parser')
images = bs.find_all('img', {'src':re.compile('.jpg')})
for image in images: 
    print(image['src']+'\n')

Выходные данные скрипта можно найти по адресу: https://1.amazonaws.com/awer/adc/45521192_15642345066.jpg

Можно ли напечатать только 45521192, поэтому вывод будет таким:

45521192
45521193
45521194
45521195

1 Ответ

2 голосов
/ 14 октября 2019

Конечно, вы можете просто изменить print(image['src']+'\n') на:

print(image['src'].split('/')[-1].split('_')[0])
...