Если вы свернете www.amazon.com, сервер ответит двоичными данными.
curl -L https://www.amazon.com | less
Тем не менее, когда вы добавляете пользовательский агент или просматриваете точно такой же URL в браузере, они отправляют действительный HTMLразметка.
curl -L -A "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_8) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.112 Safari/534.30" https://www.amazon.com | less
Почему Amazon выбрал бы отправку двоичных данных клиентам, для которых не указан пользовательский агент?Я не уверен, что они должны получить, делая это.
Конечно, они могут пытаться запутать свои ответы ботам.Но если это так, они могли бы вообще не отправлять ответ.
Любое понимание будет оценено.