Я пытаюсь обнаружить документы Word, но для некоторых документов Word это не удается. Я могу нормально открывать проблемные документы c в Word и извлекать их, так как они в основном просто zip-файлы.
Я также попытался добавить msooxml
к /etc/magic
на моем сервере Ubuntu 18.04 и перезапустить nginx & PHP FPM без удачи. Я использую PHP 7.4.4
- Есть ли способ проверить, используются ли
msooxml
? - Есть ли у вас какие-либо предложения, чтобы заставить его работать?
Вот мой код:
$file = 'broken.docx';
$mime = mime_content_type($file);
echo '<p>'.$mime.'</p>';
$finfo = new finfo(FILEINFO_MIME, 'msooxml');
echo '<p>'.$finfo->file($file).'</p>';
Результат:
application/octet-stream
application/octet-stream; charset=binary
Ожидаемый результат:
application/vnd.openxmlformats-officedocument.wordprocessingml.document
application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary
msooxml
Файл взят из: https://github.com/file/file/blob/master/magic/Magdir/msooxml