Я использовал скраб-всплеск всего несколько раз, но сильно полагаюсь на скрап. Я предполагаю, что вы используете экземпляр-заставку из scrapinghub. Я думаю, что это из-за ip, который фактически используется для выполнения запроса.
Один из примеров, который я имею, - это попытка разобраться с покупками в Google. Google отслеживает IP обратно к источнику. Так что независимо от того, как мой IP-пул находится в США. Некоторые ips отслеживают другие страны и возвращают результаты для этого округа. Скажем, у нас есть код ниже.
def start_request:
yield scrapy.Request(url='https://www.googleshopping.com/shopping/ID','splash':{})
Это вызовет scrapy для создания запроса. Даже если запрос был сделан на вашем устройстве, он отправляет этот запрос на сервер-заставку. Который может жить в докере или инсталляционном экземпляре на чистящем узле, где бы он ни был. К этому экземпляру заставки будет привязан собственный IP-адрес, и именно этот Google увидит Google. Теперь, если вы включите прокси в этот запрос, этот ip может быть из любой точки мира в зависимости от того, кто его размещает, что еще больше запутало бы ip. Короче говоря, запрос может не приходить с того IP-адреса, с которого, как вы думаете, он поступил.