Использование Databricks / Python3 .x ZipFile для извлечения 7-гигабайтного файла из zip - PullRequest
0 голосов
/ 07 февраля 2020

У меня есть большой zip-файл NPI, который включает csv 7.3 ГБ. (файл можно найти на сайте NPI здесь: http://download.cms.gov/nppes/NPI_Files.html - ежемесячный файл NPI полной замены)

При использовании extractall каждый файл извлекается в нужное место, и все файлы правильно, за исключением этого файла 7 ГБ. Извлекает только до 108,9 КБ.

Вот код ...

with zipfile.ZipFile(sourcePath, mode='r') as zip_ref:
  zip_ref.extractall(destinationPath)

Я даже добавил ", allowZip64 = True" на всякий случай, но он все равно только распаковывает файл на 108k.

Есть идеи, что я могу здесь делать не так?

...