при вызове ctakes parser из tika-app получаю исключение - PullRequest
0 голосов
/ 16 февраля 2020

При вызове синтаксического анализатора cTAKES из приложения tika получаются следующие данные:

java -classpath $HOME/src/ctakes-config:${TIKA_HOME}/tika-app/target/tika-app-X.Y-SNAPSHOT.jar:${CTAKES_HOME}/desc:${CTAKES_HOME}/resources:${CTAKES_HOME}/lib/* org.apache.tika.cli.TikaCLI --config=$HOME/src/ctakes-config/tika-config.xml -m Vose-2013-American_Journal_of_Hematology.pdf

Исключение

Снимок экрана исключения java .lang.NoSuchMethodError

enter image description here

Исключение в потоке "main" java .lang.NoSuchMethodError: opennlp.tools.sentdetect.SentenceModel.getMaxentModel () Lopennlp / model / AbstractModel ;

Я выполнил действия, указанные в по этой ссылке . Я не могу понять причину этой ошибки и, следовательно, как ее устранить.

Я также получаю следующее предупреждение: Предупреждение

16 февраля 2020 г. 12:19:58. Org. apache .tika.config.InitializableProblemHandler $ 3 handleInitializableProblem ПРЕДУПРЕЖДЕНИЕ: J2KImageReader не загружен. Файлы JPEG2000 не будут обрабатываться. См. https://pdfbox.apache.org/2.0/dependencies.html#jai -image-io для дополнительных зависимостей.

16 февраля 2020 г. 12:19:59 org. apache .tika.config.InitializableProblemHandler $ 3 handleInitializableProblem ПРЕДУПРЕЖДЕНИЕ: org sqlite-jdb c .xerial не загружен. Пожалуйста, предоставьте банку на вашем classpath для разбора файлов sqlite. См. Tika-parsers / pom. xml для правильной версии.

Я пытался разрешить ее, используя ответы в по этой ссылке , но это не сильно помогло , я знаю, что это только предупреждения, и надеюсь, что ошибка не вызывает ошибку, и я использую tika только для установки

Информация о системе

  • ОС Ubuntu 16.04
  • JDK openJDK8.
  • Maven 3.3.9
  • Apache tika 1.23
  • Apache cTAKES 3.2.2

Ответы [ 2 ]

1 голос
/ 19 марта 2020

Я обратился к этому. Это было связано с несовместимыми версиями библиотеки Apache OpenNLP. Синтаксический анализатор Tika CTAKES был прикреплен к 1.5.3, и cTAKES 3.2.2 использует эту версию, но с тех пор Tika Parsers эволюционировал для использования более новой версии.

Исправление было связано со старым jar OpenNLP 1.5.3. в пути к классам. Я обновил вики здесь: https://cwiki.apache.org/confluence/display/TIKA/CTAKESParser

java -classpath $HOME/src/ctakes-config:${CTAKES_HOME}/lib/opennlp-tools-1.5.3.jar:${TIKA_HOME}/tika-app/target/tika-app-X.Y-SNAPSHOT.jar:${CTAKES_HOME}/desc:${CTAKES_HOME}/resources:${CTAKES_HOME}/lib/\* org.apache.tika.cli.TikaCLI \
--config=$HOME/src/ctakes-config/tika-config.xml \
-m Vose-2013-American_Journal_of_Hematology.pdf 
0 голосов
/ 20 февраля 2020

Мне удалось вызвать cTAKES из приложения tika после установки Apache tika-1.10 Обе версии cTAKES и TIKA были несовместимы

...