Чтобы отключить эти предупреждения, вам нужно отключить их в конфигурационном файле Tika.
tika.xml:
<?xml version="1.0" encoding="UTF-8"?>
<properties>
<service-loader initializableProblemHandler="ignore"/>
</properties>
и затем используйте этот файл конфигурации в вашем коде:
(let [handler (BodyContentHandler.)
config (TikaConfig. (FileInputStream. "tika.xml"))
parser (AutoDetectParser. config)
metadata (Metadata.)
stream (FileInputStream. "resources/memory.pdf")]
(.parse parser stream handler metadata)
(prn (str handler)))
Чтобы включить поддержку JBIG и всего остального, вы должны обратиться к tika-parsers-1.17.jar!/META-INF/maven/org.apache.tika/tika-parsers/pom.xml
, который содержит все ссылки на поддерживаемые плагины вместе с их версиями. Добавьте эти плагины в ваши зависимости.
Для [com.novemberain/pantomime "2.10.0"]
вы должны пойти с
[com.levigo.jbig2/levigo-jbig2-imageio "1.6.5"]
[com.github.jai-imageio/jai-imageio-core "1.3.1"]
[com.github.jai-imageio/jai-imageio-jpeg2000 "1.3.0"]
Это работает для Java 1.8, но я считаю, что это не будет работать для Java 1.10, которая теперь имеет этот новый модуль. Один из этих плагинов не поддерживает это.