Обнаружение документов Word - PullRequest
0 голосов
/ 22 апреля 2020

Я пытаюсь обнаружить документы Word, но для некоторых документов Word это не удается. Я могу нормально открывать проблемные документы c в Word и извлекать их, так как они в основном просто zip-файлы.

Я также попытался добавить msooxml к /etc/magic на моем сервере Ubuntu 18.04 и перезапустить nginx & PHP FPM без удачи. Я использую PHP 7.4.4

  • Есть ли способ проверить, используются ли msooxml?
  • Есть ли у вас какие-либо предложения, чтобы заставить его работать?

Вот мой код:

$file = 'broken.docx';

$mime = mime_content_type($file);

echo '<p>'.$mime.'</p>';

$finfo = new finfo(FILEINFO_MIME, 'msooxml');

echo '<p>'.$finfo->file($file).'</p>';

Результат:

application/octet-stream

application/octet-stream; charset=binary

Ожидаемый результат:

application/vnd.openxmlformats-officedocument.wordprocessingml.document

application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary

msooxml Файл взят из: https://github.com/file/file/blob/master/magic/Magdir/msooxml

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...