В настоящее время я пытаюсь сканировать сайт электронной коммерции после входа в него, но кажется, что я делаю что-то не так, потому что scrap его только сканирование (нет информации о входе в консоль)
class InsSpider(scrapy.Spider):
name = 'loginin'
allowed_domains = ['examplesite.com.ar']
url = 'http://www.examplesite.com.ar'
url_login = 'http://www.examplesite.com.ar/account'
def start_requests(self):
return [Request(self.url_login, callback=self.login)]
def login(self, response):
login_post = {'username': 'user',
'password': 'pass'}
return [FormRequest.from_response(response,
formdata=login_post,
# callback=self.start_requests,
dont_filter=True
)]
class MercadoSpider(CrawlSpider):
name = 'extractor'
//crawling code
Как мне правильно зайти на страницу?
Это логин html:
<form method="post" action="" class="form">
<fieldset class="col-md-8">
<legend>Ingresar</legend>
<div class="form-group"><label>Email</label> <input type="text" id="loginUserID" name="loginUserID" value="" class="form-control" /></div>
<div class="form-group"><label>Contraseña</label> <input type="password" id="loginPass" name="loginPass" value="" class="form-control" /></div>
<div class="form-group"><button type="submit" class="btn btn-primary">Login</button></div>
<p><a href="/password/recover">Olvidó su contraseña?</a></p>
<p>No está registrado? <a href="/users/register">Regístrese aquí</a></p>
</fieldset>
</form>