У меня очень ограниченные знания в области сканирования и сканирования в Интернете, и я пытаюсь создать веб-сканер для этого URL
. Однако, когда я пробую обычную печать текста ответа с сервера, я получаю следующее:
<html><body><h1>400 Bad request</h1>
Your browser sent an invalid request.
</body></html>
Я не думаю, что с кодом что-то не так, поскольку он работает на других сайтах, которые я пробовал это на. Надеюсь, что вы, ребята, здесь, можете помочь мне понять это. И это только догадка, но это вызвано тем, что URL не заканчивается на .xml
?
import requests
url = 'https://phys.org/rss-feed/'
res = requests.get(url)
print(res.text[:500])