Я собираюсь сканировать страницу url = 'https://e-justice.europa.eu/searchBris.do', чтобы представить свою собственную информацию. Я использовал request.get (url) для получения содержания html страницы.
requests.get(url)
но я получаю страницу перенаправления в качестве результата запроса следующим образом:
\n\n\n\n\n\n\n<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">\n<html lang="en">\n <head>\n <title>Find a company</title>\n <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">\n\n <script> \n top.location.reload();\n </script>\n\n <noscript><meta http-equiv="refresh" content="0;url=https://e-justice.europa.eu/searchBris.do"/></noscript>\n </head>\n <body>\n <h1>Redirecting...</h1>\n </body>\n</html>
Я также протестировал параметр allow_redirect, а также session.get () и session.post () решает следующим образом, но перенаправленный вывод остается и доступ к html URL запрещен.
requests.get(url, allow_redirects=True)
session.get(url, allow_redirects=True)
requests.post(url, allow_redirects=True)
session.post(url, allow_redirects=True)
Есть ли какое-либо решение для получения содержимого исходного URL?