Различия в написании User-Agent действительно не имеют значения? - PullRequest
0 голосов
/ 05 ноября 2019

Я не уверен, что этот вопрос уже обсуждался, но я ничего не нашел по этому поводу. Я использую библиотеку запросов Python для очистки веб-сайтов. Чтобы подделать пользовательские агенты обычных браузеров, таких как Firefox или Google, я обнаружил, что пользовательский агент общего запроса всегда пишется так: «User-Agent: ...». Применительно к RFC стиль написания не зависит от регистра. При этом не следует учитывать, что пользовательский агент пишется заглавными буквами, а не строчными. Но так ли это? Если пользовательские агенты всегда пишутся одинаково, то было бы проще всего найти шаблон с точки зрения обнаружения ботов. Я нашел много примеров кода со списками пользовательских агентов для специализированных скребков, которые принимали строчные буквы. Кто-нибудь проверял, действительно ли это не имеет значения?

...