Я бы хотел провести различие между файлом ZIP и файлом Microsoft Office (xlsx, docx, pptx), используя только двоичную строку. Все первые 4 байта 0x504b0304
, но когда я попытался использовать библиотеку Python zipfile
для чтения ее в память, она выдала ошибку zipfile.BadZipFile: File is not a zip file
. Я попробовал тот же код с реальными файлами zip, и он работает. Означает ли это, что эти файлы на самом деле являются файлами Microsoft Office? Или это могут быть они усечены / повреждены?
Есть ли способ определить ZIP-файл и файлы Microsoft Office?