Почему файловая утилита идентифицирует файлы Microsoft Word как CDF?Что это за CDF? - PullRequest
17 голосов
/ 06 февраля 2011

У меня есть несколько старых файлов Microsoft Word (возможно, Word 97), и я заметил, что стандартная файловая утилита Unix идентифицирует такие файлы как "CDF". Это на самом деле более точно, выводит подробные метаданные, например:

CDF V2 Document,
Little Endian, 
Os: Windows, 
Version 4.0, 
Code page: 1252, 
Title: ..., 
Author: ..., 
Template: Normal.dot, 
Last Saved By: ..., 
Revision Number: 1, 
Name of Creating Application: Microsoft Word 8.0, 
Create Time/Date: ..., 
Last Saved Time/Date: ..., 
Number of Pages: 1, 
Number of Words: 95, 
Number of Characters: 542, 
Security: 0

Что означает этот CDF? Это общий формат контейнера, например, RIFF для медиа-файлов? Я не могу найти ничего полезного в Интернете. «Формат определения канала» и «Формат составного документа» явно не подразумеваются, поскольку эти файлы Microsoft Word являются полностью двоичными. Для Общий формат данных Я не могу найти соединение. Я пытался найти что-то в исходном коде файла util (в версии, поставляемой с FreeBSD), но я мог только узнать, что у него есть выделенный readcdf.c, который имеет дело с этим форматом.

1 Ответ

18 голосов
/ 06 февраля 2011

Сложный формат документов относится к OLE / COM. Это относится к связыванию и встраиванию объектов, например, диаграмм Excel в документы Word.

См. Исторические (до XML) спецификации документа для MS Office , а конкретное описание формата файла - "Спецификация формата двоичного файла составного файла Windows".

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...