У меня есть скрипт, который очищает конкретный веб-сайт, где номер страницы определяется с помощью ?start={}
. Этот сайт .
Это мой скрипт:
from bs4 import BeautifulSoup
from urllib.request import urlopen
def parse():
for i in range(0, 480, 5):
html = urlopen('http://rl.odessa.ua/index.php/ru/poslednie-novosti?start={}'.format(i))
soup = BeautifulSoup(html, 'lxml')
for article in soup.findAll('article', class_ = 'item'):
try:
print('\t' + article.find('h1').find('a').get_text())
print(article.find('p').get_text() + '\n' + '*'*80)
except AttributeError as e:
print(e)
parse()
В нижней части страницы находится div.pagination с a.next. Вот скриншот.
Это плохая практика с использованием range()
вместо нумерации страниц?В любом случае, пожалуйста, помогите мне переписать код выше, используя нумерацию страниц.