Почему результат очистки Python отличается от браузера - PullRequest
0 голосов
/ 31 августа 2018

Я могу просматривать страницу https://www.xiami.com/artist/O9fc383 в браузере, но когда я анализирую ее с помощью драйвера chrome, у меня появляется другой источник, как показано ниже, так что я не могу очистить эту страницу, что я могу сделать? В браузере нет этой формы для источника.

...
<form action="//www.xiami.com:443/artist/O9fc383/_____tmd_____/verify/" id="nc-verify-form" method="GET">
...
<script>
    var referrer=document.referrer;
    if (referrer && referrer.indexOf("__tmd__")===-1 ){
        localStorage.x5referer = document.referrer;
    }else{
        localStorage.x5referer = window.location.href;
    }
</script>

1 Ответ

0 голосов
/ 31 августа 2018

Какую библиотеку вы используете для очистки? Если вы используете красивый суп или urllib, вы не можете очистить код, сгенерированный javascript. Вам придется использовать что-то вроде Silenium Очистка отрисованной страницы JS

...