Scrapy выполняет HTTP-запросы. Данные после '#' в URL не являются частью HTTP-запроса, они используются JavaScript.
Как предлагается в комментариях, сайт загружает данные с использованием AJAX.
Более того, он не использует разбиение на страницы в AJAX: сайт загружает весь список часов в формате JSON за один запрос, а затем разбиение на страницы выполняется с использованием JavaScript.
Таким образом, вы можете просто использовать вкладку Сеть инструментов разработчика вашего веб-браузера, чтобы просмотреть запрос, который получает данные JSON, и выполнить аналогичный запрос вместо запроса страницы HTML.
Обратите внимание, однако, что вы не можете использовать LinkExtractor
для данных JSON. Вам просто нужно проанализировать ответ с помощью json
в Python и повторить там URL-адреса.