Как я могу войти на сайт с Python? - PullRequest
72 голосов
/ 26 мая 2010

Как я могу это сделать? Я пытался ввести указанную ссылку (с помощью urllib), но чтобы сделать это, мне нужно войти в систему.

У меня есть этот источник с сайта:

<form id="login-form" action="auth/login" method="post">
    <div>
    <!--label for="rememberme">Remember me</label><input type="checkbox" class="remember" checked="checked" name="remember me" /-->
    <label for="email" id="email-label" class="no-js">Email</label>
    <input id="email-email" type="text" name="handle" value="" autocomplete="off" />
    <label for="combination" id="combo-label" class="no-js">Combination</label>
    <input id="password-clear" type="text" value="Combination" autocomplete="off" />
    <input id="password-password" type="password" name="password" value="" autocomplete="off" />
    <input id="sumbitLogin" class="signin" type="submit" value="Sign In" />

Возможно ли это?

Ответы [ 7 ]

58 голосов
/ 26 мая 2010

Может быть, вы хотите использовать твил (он основан на механизировать ). Он довольно прост в использовании и должен делать то, что вы хотите.

Это будет выглядеть следующим образом:

from twill.commands import *
go('http://mysite.org')

fv("1", "email-email", "blabla.com")
fv("1", "password-clear", "testpass")

submit('0')

Вы можете использовать showforms() для отображения всех форм после того, как вы использовали go(...), чтобы перейти на сайт, на который вы хотите войти. Просто попробуйте это из интерпретатора Python.

41 голосов
/ 20 февраля 2015

Позвольте мне упростить задачу. Предположим, что URL-адрес сайта - www.example.com, и вам нужно зарегистрироваться, указав имя пользователя и пароль, поэтому мы переходим на страницу входа: просмотрите его исходный код и найдите URL действия, он будет в теге формы, например,

 <form name="loginform" method="post" action="userinfo.php">

теперь возьмите userinfo.php, чтобы создать абсолютный URL, который будет 'http://example.com/userinfo.php',, теперь запустите простой скрипт на python

import requests
url = 'http://example.com/userinfo.php'
values = {'username': 'user',
          'password': 'pass'}

r = requests.post(url, data=values)
print r.content

Надеюсь, это кому-нибудь когда-нибудь поможет.

24 голосов
/ 26 мая 2010

Обычно для входа на сайт вам нужны файлы cookie, что означает cookielib, urllib и urllib2. Вот класс, который я написал, когда играл в веб-игры на Facebook:

import cookielib
import urllib
import urllib2

# set these to whatever your fb account is
fb_username = "your@facebook.login"
fb_password = "secretpassword"

class WebGamePlayer(object):

    def __init__(self, login, password):
        """ Start up... """
        self.login = login
        self.password = password

        self.cj = cookielib.CookieJar()
        self.opener = urllib2.build_opener(
            urllib2.HTTPRedirectHandler(),
            urllib2.HTTPHandler(debuglevel=0),
            urllib2.HTTPSHandler(debuglevel=0),
            urllib2.HTTPCookieProcessor(self.cj)
        )
        self.opener.addheaders = [
            ('User-agent', ('Mozilla/4.0 (compatible; MSIE 6.0; '
                           'Windows NT 5.2; .NET CLR 1.1.4322)'))
        ]

        # need this twice - once to set cookies, once to log in...
        self.loginToFacebook()
        self.loginToFacebook()

    def loginToFacebook(self):
        """
        Handle login. This should populate our cookie jar.
        """
        login_data = urllib.urlencode({
            'email' : self.login,
            'pass' : self.password,
        })
        response = self.opener.open("https://login.facebook.com/login.php", login_data)
        return ''.join(response.readlines())

Вам не обязательно понадобятся обработчики HTTPS или Redirect, но они не повреждают, и это делает открывающее устройство намного более устойчивым. Вам также могут не понадобиться файлы cookie, но это трудно определить по форме, которую вы разместили. Я подозреваю, что вы могли бы сделать это только из комментария «Запомнить меня», который был закомментирован.

18 голосов
/ 26 мая 2010
import cookielib
import urllib
import urllib2

url = 'http://www.someserver.com/auth/login'
values = {'email-email' : 'john@example.com',
          'password-clear' : 'Combination',
          'password-password' : 'mypassword' }

data = urllib.urlencode(values)
cookies = cookielib.CookieJar()

opener = urllib2.build_opener(
    urllib2.HTTPRedirectHandler(),
    urllib2.HTTPHandler(debuglevel=0),
    urllib2.HTTPSHandler(debuglevel=0),
    urllib2.HTTPCookieProcessor(cookies))

response = opener.open(url, data)
the_page = response.read()
http_headers = response.info()
# The login cookies should be contained in the cookies variable

Для получения дополнительной информации посетите: https://docs.python.org/2/library/urllib2.html

8 голосов
/ 04 июля 2018

Автоматизация веб-страниц? Определенно "webbot"

webbot даже работает с веб-страницами, которые динамически меняют имена и имена классов и имеют больше методов и возможностей, чем селен или механизированы.

Вот фрагмент:)

from webbot import Browser 
web = Browser()
web.go_to('google.com') 
web.click('Sign in')
web.type('mymail@gmail.com' , into='Email')
web.click('NEXT' , tag='span')
web.type('mypassword' , into='Password' , id='passwordFieldId') # specific selection
web.click('NEXT' , tag='span') # you are logged in ^_^

Документы также довольно просты и просты в использовании: https://webbot.readthedocs.io

6 голосов
/ 26 мая 2010

Веб-сайты в целом могут проверять авторизацию различными способами, но тот, на который вы ориентируетесь, кажется, делает его достаточно легким для вас.

Все, что вам нужно, - это POST на auth/login URL-адрес блоба с закодированной формой с различными полями, которые вы видите там (забудьте о ярлыках for, они являются украшением для посетителей-людей). handle=whatever&password-clear=pwd и т. Д., Если вы знаете значения для дескриптора (адрес электронной почты AKA) и пароля, все будет в порядке.

Предположительно, что POST перенаправит вас на какую-нибудь страницу "Вы успешно вошли в систему" с заголовком Set-Cookie, подтверждающим ваш сеанс (обязательно сохраните этот файл cookie и отправьте его обратно для дальнейшего взаимодействия по сеансу!).

4 голосов
/ 15 декабря 2013

Для вещей HTTP текущий выбор должен быть: Запросы - HTTP для людей

...