Я хочу очистить следующую страницу:
http://www.ferdinand -hodler.ch / werke.aspx? ID = 6006188
Если вы не видите содержимое страницы, добро пожаловать в клуб. Он перенаправляет меня на главную страницу, затем, когда я сначала щелкаю книгу на главной странице, а затем нажимаю «Работы» (или Werke на немецком языке), а затем нажимаю на картинку, он, наконец, позволяет мне использовать отдельные ссылки для ввода других стр.
Я пытался установить заголовки, но это работало только временно. (Теперь он не работает, хотя я обновляю его.)
Есть решение?
Пока мой код.
headers = {
"Cache-Control": "max-age=0",
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8",
"Cookie": "ASP.NET_SessionId=ovakll55jo1wgo55mpizx2eg; sikart=de; _ga=GA1.2.868599919.1540663052; _gid=GA1.2.1406101683.1540663052"
}
s = requests.Session()
page = s.get("http://www.ferdinand-hodler.ch/werke.aspx?id=6006188"
,headers=headers)
file = page.content
print("Provenienz" not in str(file)) # I need this to be true.