Здесь - это ссылка на ForensicsWiki, в которой подробно описаны различные типы файлов.Он описывает заголовки как файлов DOC, так и файлов DOCX, поэтому вы должны иметь возможность проанализировать файлы и определить, какие они есть.
Если посмотреть по ссылке, файлы .doc являются файлами OLE Compound, файл должен иметьследующий двоичный заголовок:
d0 cf 11 e0 a1 b1 1a e1
В отличие от этого, файлы .docx будут иметь двоичную подпись:
50 4b