Похоже, вы почти не представляете, что делаете. Я довольно новичок в Scrapy, но я думаю, вы захотите что-то вроде
Rule(SgmlLinkExtractor(allow=('http\://example\.com/message/.*\.aspx', )), callback='parse_item'),
Попробуйте написать регулярное выражение, совпадающее с полным URL-адресом ссылки, который вы хотите. Кроме того, похоже, вам нужно только одно правило. Добавьте обратный вызов к первому. Экстрактор ссылок сопоставляет каждую ссылку, сопоставленную с регулярным выражением в allow, и исключает ссылки, сопоставленные с deny, и оттуда каждая из оставшихся страниц будет загружена и передана в parse_item
.
Я говорю все это, ничего не зная о странице, на которой вы ведете анализ данных, и о природе данных, которые вы хотите. Вы хотите, чтобы этот вид паука для страницы, которая имеет ссылки на страницы, на которых есть данные, которые вы хотите.