При вызове синтаксического анализатора cTAKES из приложения tika получаются следующие данные:
java -classpath $HOME/src/ctakes-config:${TIKA_HOME}/tika-app/target/tika-app-X.Y-SNAPSHOT.jar:${CTAKES_HOME}/desc:${CTAKES_HOME}/resources:${CTAKES_HOME}/lib/* org.apache.tika.cli.TikaCLI --config=$HOME/src/ctakes-config/tika-config.xml -m Vose-2013-American_Journal_of_Hematology.pdf
Исключение
Снимок экрана исключения java .lang.NoSuchMethodError
Исключение в потоке "main" java .lang.NoSuchMethodError: opennlp.tools.sentdetect.SentenceModel.getMaxentModel () Lopennlp / model / AbstractModel ;
Я выполнил действия, указанные в по этой ссылке . Я не могу понять причину этой ошибки и, следовательно, как ее устранить.
Я также получаю следующее предупреждение: Предупреждение
16 февраля 2020 г. 12:19:58. Org. apache .tika.config.InitializableProblemHandler $ 3 handleInitializableProblem ПРЕДУПРЕЖДЕНИЕ: J2KImageReader не загружен. Файлы JPEG2000 не будут обрабатываться. См. https://pdfbox.apache.org/2.0/dependencies.html#jai -image-io для дополнительных зависимостей.
16 февраля 2020 г. 12:19:59 org. apache .tika.config.InitializableProblemHandler $ 3 handleInitializableProblem ПРЕДУПРЕЖДЕНИЕ: org sqlite-jdb c .xerial не загружен. Пожалуйста, предоставьте банку на вашем classpath для разбора файлов sqlite. См. Tika-parsers / pom. xml для правильной версии.
Я пытался разрешить ее, используя ответы в по этой ссылке , но это не сильно помогло , я знаю, что это только предупреждения, и надеюсь, что ошибка не вызывает ошибку, и я использую tika только для установки
Информация о системе
- ОС Ubuntu 16.04
- JDK openJDK8.
- Maven 3.3.9
- Apache tika 1.23
- Apache cTAKES 3.2.2