Я пытаюсь очистить данные с нескольких веб-страниц с помощью BeautifulSoup. Каждая из этих веб-страниц имеет одинаковый формат с кодом в конце, который однозначно идентифицирует их, например, для. www.sample_000.com
. Проблема в том, что если я случайно выберу код 123 и попытаюсь очистить www.sample_123.com
, я ничего не получу, так как страница не существует. Я получаю ошибку HTTP 404, если пытаюсь открыть ее из браузера напрямую. Однако, если я захожу на основной веб-сайт и выбираю соответствующие входные значения, чтобы открыть www.sample_123.com
, он загружается просто отлично.
После загрузки его один раз с основного веб-сайта, теперь я могу очистить его и открыть его в браузере независимо, не заходя на основной веб-сайт. Что здесь происходит и как я могу очистить эти веб-страницы, не открывая их сначала через главный веб-сайт?
Обновление: я пытался использовать Selenium для загрузки каждой веб-страницы с использованием соответствующих входных данных перед ее очисткой. Это работает сейчас, но невероятно медленно. Был бы очень признателен, если кто-то, если порекомендовать более быстрый метод.