тип файла с использованием filecontent - PullRequest
1 голос
/ 12 июля 2010

У меня есть filecontent в байтовом массиве, и как найти тип этого файла из содержимого этого байтового массива?Как .doc, .docx, .jpg?Спасибо

Ответы [ 2 ]

2 голосов
/ 12 июля 2010

Нет общего ответа. Большинство форматов файлов можно узнать, посмотрев содержимое, проанализировав заголовок. Однако «стандартного» заголовка не существует, и многие форматы вообще не имеют заголовка (например, CSV).

Если содержимое поступает из файла на диске, создайте FileInfo и запросите его расширение.

Если у вас есть только контент, вам придется создавать собственные анализаторы, которые смотрят на заголовки и / или гадают на основе других фактов (например, текста с большим количеством запятых ...).

0 голосов
/ 12 июля 2010

Прежде чем получать файлы в байтовом массиве, получите FileExtension и используйте ID для своего байта и расширения для поиска с индексом.

...