При использовании библиотеки запросов в Python для извлечения HTML указанного URL, например. следующим образом:
import requests
temp = requests.get(URL)
HTML = temp.text
Для некоторых URL-адресов это будет запрещено Nginx, возвращая только следующие HTML:
<html>
<head><title>403 Forbidden</title></head>
<body>
<center><h1>403 Forbidden</h1></center>
<hr><center>nginx</center>
</body>
</html>
Однако для этих URL-адресов, если я просматриваю их в любом веб-браузере, я могу просматривать веб-страницы без каких-либо запрещенных ошибок.
Несколько примеров веб-страниц, где это имеет место:
URL = http://socialmarketingwriting.com/complete-guide-successful-social-media-manager/
URL = https://rjmccollam.com/podcast/3/
Можно ли что-нибудь сделать в этих случаях, чтобы избежать ошибки 403?