Как сканировать этот URL-адрес, используя urllib? - PullRequest
2 голосов
/ 24 октября 2011

Я пытаюсь использовать urllib для сканирования этого файла: http://www.anzhi.com/dl_app.php?s=68611,, но всегда загружаю неправильный файл (размер меньше).Тем не менее, если я открою эту ссылку на Chrome, она пойдет хорошо, и размер загруженного файла будет правильным.Код прилагается, в чем проблема?

import urllib

apk = "http://sc.hiapk.com/Download.aspx?aid=294091"
local=r'x.apk'

webFile = urllib.urlopen(apk)

localFile = open(local, "w")
realurl = webFile.geturl()
print realurl
realFile = urllib.urlopen(realurl)
localFile.write(realFile.read())
webFile.close()
realFile.close()
localFile.close()

Ответы [ 2 ]

2 голосов
/ 24 октября 2011

На какой ОС вы работаете? Эта строка кода:

localFile = open(local, "w")

открывает файл текстового режима в Windows, который будет делать то, что вы не хотите. Меняет ли это на

localFile = open(local, "wb")

(открытие файла в двоичном режиме), чтобы все работало правильно?

1 голос
/ 12 ноября 2011

Вы не используете в своем коде тот же URL, о котором спрашиваете в вопросе.Используйте URL anzhi.com, и вы получите нужный файл.:)

...