Это потому, что DOCX - это ZIP-файл :
Файл Office Open XML - это совместимый с ZIP пакет OPC, содержащий документы XML и другие ресурсы.
Как и файлы Open Office, документы представляют собой ZIP-файлы, содержащие различные ресурсы в структурированной и четко определенной форме. Поэтому, когда вы пытаетесь идентифицировать содержимое файла, вы сначала видите, что это ZIP-файл. Затем вам нужно будет заглянуть внутрь ZIP, чтобы решить, будет ли это файл DOCX или OpenOffice.
В качестве альтернативы вы могли бы взглянуть на расширение файла: если вы определили, что файл является ZIP-файлом, а расширение окажется .doc
или .docx
, то вы можете предположить, что это файл OOXML.