Моя проблема в том, что я не знаю, как извлечь файл XML, когда мне нужно авторизоваться для доступа к нему.
, поэтому мой файл XML находится по адресу url = "ftp://ftp.Dom.com/BlaBla / "user =" self "pass =" secret ".
В документации scrapy я обнаружил нечто похожее на html и попытался адаптировать его под свои нужды.
Вот мойкод atm:
class kelly(XMLFeedSpider):
name = "kelly"
allowed_domains = []
start_urls = ["ftp://ftp.Dom.com/BlaBla/"]
itertag='Job'
def __init__(self, name=None, **kwargs):
XMLFeedSpider.__init__(self)
self.secret_users = {}
pipe_import = ImportLaunch()
pipe_import.pipe = Pipe.objects.first()
pipe_import.save()
self.pipe_import = pipe_import
def parse_node(self, response):
import pdb
pdb.set_trace()
return [FormRequest.from_response(response,
formdata={'username': 'myself', 'password': 'secret'},
callback=self.parse_after_log)]
def parse_after_log(self,response):
# check login succeed before going on
if "authentication failed" in response.body:
self.log("Login failed", level=log.ERROR)
return
# We've successfully authenticated, let's have some fun!
else:
return Request(url="ftp://ftp.Dom.com/BlaBla/kelly_polarbear.xml", callback=self.parse_tastypage)
def parse_tastypage(self,response,node):
print 'I passed !!'
но мое сообщение все еще
`2012-03-01 12:27:28+0100 [kelly] ERROR: Error downloading <GET ftp://ftp.kellyservices.com`/Polarbear/>: 530 User anonymous cannot log in.
спасибо за помощь