Я построил паука scrapy, который принимает user_id в качестве аргумента командной строки и получает URL-адреса из базы данных. Теперь я хочу, чтобы мое приложение было масштабируемым.
В то же время я смотрел на некоторые из решений, представленных в Интернете, но не все они в точности соответствуют моим требованиям, так как в некоторых из них предлагается передать кучу URL-адресов в scrap и выполнять очистку, а другие предлагают использовать корневой URL-адрес и оставить все для Scrapy, но мой вариант использования совершенно другой. Я ищу подход здесь.
Вместо того, чтобы распространять URL-адреса, если бы я мог распределить идентификаторы клиентов по паукам, это тоже подойдет.