Использование CookieJar в Python для входа на сайт из "Google App Engine". Что здесь не так? - PullRequest
0 голосов
/ 03 апреля 2010

Я пытался найти код Python, который мог бы войти в мой почтовый ящик на yahoo.com из "Google App Engine" , Здесь (нажмите здесь, чтобы увидеть эту страницу) Мне дали этот код:

import urllib, urllib2, cookielib

url = "https://login.yahoo.com/config/login?"
form_data = {'login' : 'my-login-here', 'passwd' : 'my-password-here'}

jar = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(jar))
form_data = urllib.urlencode(form_data)
# data returned from this pages contains redirection
resp = opener.open(url, form_data)
# yahoo redirects to http://my.yahoo.com, so lets go there instead
resp = opener.open('http://mail.yahoo.com')
print resp.read()

Автор этого сценария изучил HTML-сценарий Форма входа в Yahoo и придумал этот сценарий.

Эта форма входа в систему содержит два поля, одно для пользователей Yahoo! ID и еще один для пароля пользователя. Вот как выглядит HTML-код этой страницы для обоих полей:

Поле идентификатора пользователя:

<input type="text" maxlength="96" class="yreg_ipt" size="17" value="" id="username" name="login">

Поле пароля:

<input type="password" maxlength="64" class="yreg_ipt" size="17" value="" id="passwd" name="passwd">

Однако, когда я загрузил этот код в Google App Engine, я обнаружил, что эта форма входа продолжает возвращаться ко мне, что, как я полагаю, означает, что процесс входа не прошел Почему так?

1 Ответ

3 голосов
/ 03 апреля 2010

Вы отправляете хеш MD5, а не простой пароль. Кроме того, вам придется подыгрывать всем видам защиты CSRF и т. Д., Которые они реализуют. Посмотрите:

            <input type="hidden" name=".tries" value="1"> 
            <input type="hidden" name=".src" value="ym"> 
            <input type="hidden" name=".md5" value=""> 
            <input type="hidden" name=".hash" value=""> 
            <input type="hidden" name=".js" value=""> 
            <input type="hidden" name=".last" value=""> 
            <input type="hidden" name="promo" value=""> 
            <input type="hidden" name=".intl" value="us"> 
            <input type="hidden" name=".bypass" value=""> 
            <input type="hidden" name=".partner" value=""> 
            <input type="hidden" name=".u" value="bd5tdpd5rf2pg"> 
            <input type="hidden" name=".v" value="0"> 
            <input type="hidden" name=".challenge" value="5qUiIPGVFzRZ2BHhvtdGXoehfiOj"> 
            <input type="hidden" name=".yplus" value=""> 
            <input type="hidden" name=".emailCode" value=""> 
            <input type="hidden" name="pkg" value=""> 
            <input type="hidden" name="stepid" value=""> 
            <input type="hidden" name=".ev" value=""> 
            <input type="hidden" name="hasMsgr" value="0"> 
            <input type="hidden" name=".chkP" value="Y"> 
            <input type="hidden" name=".done" value="http://mail.yahoo.com"> 
            <input type="hidden" name=".pd" value="ym_ver=0&c=&ivt=&sg="> 

Запустите Wireshark и поиграйте с ним. Удачи:)

Однако, если вы намереваетесь использовать его с App Engine, имейте в виду, что использование Google IP почти наверняка вызовет проблему с Captcha. Также Yahoo может заблокировать ваш User-Agent, который постоянно устанавливается Google.

...