Используйте urllib2.urlopen()
для данных архива и список каталогов.
Для обработки архивов с модулем zipfile
их можно записать в файл на диске, который затем передается конструктору zipfile.ZipFile
.Извлечь данные просто, используя read()
для файлового объекта, возвращаемого urllib2.urlopen()
.
Извлечение каталогов:
>>> files = urllib2.urlopen('ftp://ftp2.census.gov/geo/tiger/TIGER2008/01_ALABAMA/').read().splitlines()
>>> for l in files[:4]: print l
...
drwxrwsr-x 2 0 4009 4096 Nov 26 2008 01001_Autauga_County
drwxrwsr-x 2 0 4009 4096 Nov 26 2008 01003_Baldwin_County
drwxrwsr-x 2 0 4009 4096 Nov 26 2008 01005_Barbour_County
drwxrwsr-x 2 0 4009 4096 Nov 26 2008 01007_Bibb_County
>>>
Или разделение для имен каталогов:
>>> for l in files[:4]: print l.split()[-1]
...
01001_Autauga_County
01003_Baldwin_County
01005_Barbour_County
01007_Bibb_County