У меня есть однофайловый паук, который сканирует только сайт. Какую информацию может видеть владелец сайта?
Здесь я не использую пользовательские настройки. (Это настройка по умолчанию).
Пример:
1. Имя паука
2.IP
3.OS
Владелец сайта может видеть эту информацию.
USER_AGENT
Cookies. По умолчанию в Scrapy включены файлы cookie. Go в настройки и найдите COOKIES_ENABLED Удалите комментарий, чтобы он был установлен на False. Это сделало бы очистку более незаметной.
COOKIES_ENABLED
Concurrent_Requests. Так же и в настройках. Это то, сколько запросов вы делаете одновременно. Лучше уменьшить число, чтобы сайт был удобнее.