Apache Tika обнаруживает неправильный тип docx - PullRequest
0 голосов
/ 21 мая 2019

Я использую Apache tika, чтобы увидеть, соответствует ли расширение файла фактическому mimetype. Например, если файл называется .pdf, но на самом деле является .exe, он вернет false.

Я отправляю .docx с типом mime

применение / vnd.openxmlformats-officedocument.wordprocessingml.document

Тика делает .detect на содержание и говорит, что это

application & # x2F; x-tika-ooxml

Есть идеи, что может быть не так? Очевидно, что метод возвращает false в этом случае, потому что они не совпадают.

...