На этой странице есть форма с тремя полями:
<input type="hidden" name="wa" value="wsignin1.0" />
<input type="hidden" name="wresult" value="(encoded XML)" />
<input type="hidden" name="wctx" value="rm=0& id=passive& ru=%2f"/>
И веб-сайт использует скрипт для публикации этой формы сразу после загрузки страницы:
window.setTimeout('document.forms[0].submit()', 0);
Это означает, что вам нужно сделать то же самое.
- Узнайте, как извлечь поля формы и их значения из ответа HTML.
- Узнайте, как сделать сообщение формы с помощью Python. Это возможно с помощью urllib, но с более развитой библиотекой, такой как
requests
, это намного проще . - Добавьте эти три поля формы и их значения и отправьте запрос POST на URL-адрес в атрибуте действия
<form>
. - Библиотека веб-поиска
scrapy
также предлагает функция для этого , которая упростит шаги № 1 и № 2.
(без примера кода, вы должны быть в состоянии понять все это с помощью информации выше .)