Я получил это для работы с соответствующим селектором jquery, а также с помощью метода spynner.browser.download ().
Ссылки на файлы были вложены в теги изображений
Как только я использовал соответствующий тег для ссылки href, в которой находился файл, browser.click загрузил файл в каталог с именем www.servername.com.
Для всех файлов, заканчивающихся * .sca, например
browser.click ( 'а [HREF $ = "*. SCA"]')
Я также мог бы использовать browser.download (human_readable_url, open ("outfile.txt", "w")) для записи в указанный файл.
Код вставлен сюда
#!/usr/bin/python
import private
import spynner
from spynner import browser
import pyquery
import urlparse
import urllib
b = browser.Browser()
b.load("http://structures.com/cgi-bin/index.cgi")
#browser.debug_level = spynner.DEBUG
def fill_login_form():
b.fill("input[name=login]",private.uname)
b.fill("input[name=password]",private.password)
b.click("input[type=submit]")
def click_download():
pass
#b.create_webview(True)
b.fill("input[name=login]",private.uname)
b.fill("input[name=password]",private.password)
b.click("input[type=submit]")
b.wait_load()
d = pyquery.PyQuery(b.html)
print str(d('a[href$="ftpquota"]'))
# Test Downloading by clicking a link which will download file called .ftpquota
# Jquery pattern $= indicates a pattern that ends with "ftpquota"
#b.click('a[href$="ftpquota"]')
raw_href = d('a[href$="ftpquota"]').attr("href")
href = urllib.unquote(raw_href)
print "HREF" , raw_href
print "Unquted" , href
print "urlparse.urlsplit()", urlparse.urlsplit(href)
print "Current URL", b.url
print "Synthesized url" , urlparse.urljoin(b.url, href)
#d.make_links_absolute(base_url=b.url)
filename = raw_href.split("%2F")[-1]
b.download(href, open(filename, "w"))
загрузка сработала