Я хочу собрать данные с веб-сайта, но сначала я хочу получить страницу с нумерацией страниц. Здесь я использую Python в качестве языка программирования, и я уже получил этот код. Но когда я запускаю его, он не работает должным образом. результат должен быть остановлен, когда response.url не совпадает с ожидаемым_url. Кто-нибудь знает, как это решить? Пожалуйста, помогите, спасибо.
Вот код:
from bs4 import BeautifulSoup
import urllib.request
count = 0
url = "http://www.belanjamimo.net/foundation-bb-cream/?o=a&s=%d"
def get_url(url):
req = urllib.request.Request(url)
return urllib.request.urlopen(req)
expected_url = url % count
response = get_url(expected_url)
while (response.url == expected_url):
print("GET {0}".format(expected_url))
count += 9
expected_url = url % count
response = get_url(expected_url)