Я использую Tika для проверки типов файлов и чтобы убедиться, что никто не пытается отправить вредоносный или поддельный файл под видом подлинного. Для этого я использую Apache Tika. Однако даже если я обертываю InputStream в TikaInputStream или использую OOXMLParser или OfficeParser, он все равно возвращает application / x-tika-ooxml вместо application / vnd.openxmlformats-officedocument.wordprocessingml.document. Как я могу получить доступ или получить его для возврата подтипа?
public static boolean isValidFileMimeType(TikaInputStream stream, String[] validMimes) {
Tika tika = new Tika();
try {
Metadata meta = new Metadata();
tika.detect(stream, meta);
String mimetype = meta.get("Content-Type");
logger.debug("MIME type from TIKA is : [" + mimetype +"]");
logger.debug(meta.toString());
//return isValidFileMimeType(mimetype, validMimes);
return true;
} catch (Exception e) {
logger.error("Error validating InputStream: ", e);
return false;
}
public static boolean isValidFileMimeType(MultipartFile file, String[] mimeTypes) {
TikaInputStream in = null;
boolean isValidFile = false;
try {
in = TikaInputStream.get(file.getInputStream());
isValidFile = DataValidator.isValidFileMimeType(in, mimeTypes);
} catch (IOException e) {
logger.error("Error while validating file mime type: ", e);
} finally {
if (in != null) {
try {
in.close();
} catch (IOException e2) {
logger.error("Error while closing InputStream: ", e2);
}
}
}
return isValidFile;
}