Как провести различие между файлом ZIP и файлом Microsoft Office в Python? - PullRequest
0 голосов
/ 27 марта 2020

Я бы хотел провести различие между файлом ZIP и файлом Microsoft Office (xlsx, docx, pptx), используя только двоичную строку. Все первые 4 байта 0x504b0304, но когда я попытался использовать библиотеку Python zipfile для чтения ее в память, она выдала ошибку zipfile.BadZipFile: File is not a zip file. Я попробовал тот же код с реальными файлами zip, и он работает. Означает ли это, что эти файлы на самом деле являются файлами Microsoft Office? Или это могут быть они усечены / повреждены?

Есть ли способ определить ZIP-файл и файлы Microsoft Office?

...