Как интегрировать источник org.apache.tika в мой проект? - PullRequest
1 голос
/ 06 февраля 2012

Я скачал исходную папку Apache Tika и установил Maven. Затем с помощью командной строки (mvn install) я установил Tika:

[INFO] Reactor Summary:
[INFO] ------------------------------------------------------------------------
[INFO] Apache Tika parent .................................... SUCCESS [4:20.656s]
[INFO] Apache Tika core ...................................... SUCCESS [2:26.466s]
[INFO] Apache Tika parsers ................................... SUCCESS [3:27.711s]
[INFO] Apache Tika application ............................... SUCCESS [1:23.548s]
[INFO] Apache Tika OSGi bundle ............................... SUCCESS [3:34.223s]
[INFO] Apache Tika ........................................... SUCCESS [6.217s]
[INFO] ------------------------------------------------------------------------
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESSFUL

Но сейчас я не знаю, каков следующий шаг к использованию Тики в моем проекте. На самом деле я не знаю, как добавить Тику в мой проект.

Причина, по которой я использовал исходный код Tika вместо jar-файла, заключалась в том, что я хотел добавить farsi.ngp file в languageIdentification Tika. Я добавил farsi.ngp и собрал Tika от Maven, но теперь я не знаю, каков будет следующий шаг. Что на самом деле я должен добавить в свой проект?

1 Ответ

2 голосов
/ 06 февраля 2012

Я прочитал эту страницу, и мое предложение следующее:

После того, как вы изменили код или добавили файл .ngp и создали код, вы должны получить следующие артефакты сборки:

 tika-core/target/tika-core-1.0.jar
 tika-parsers/target/tika-parsers-1.0.jar

Где бы в вашем приложении вы не хотели использовать тика, поставьте 2 банки тика и зависимые банки в путь к классу. Например, если вы используете ant в своем приложении, добавьте его в файл сборки:

<classpath>
  ... <!-- your other classpath entries -->
  <pathelement location="path/to/tika-core-1.0.jar"/>
  <pathelement location="path/to/tika-parsers-1.0.jar"/>
  <pathelement location="path/to/commons-logging-1.1.1.jar"/>
  <pathelement location="path/to/commons-compress-1.0.jar"/>
  <pathelement location="path/to/pdfbox-1.0.0-incubating.jar"/>
  <pathelement location="path/to/fontbox-1.0.0-incubator.jar"/>
  <pathelement location="path/to/jempbox-1.0.0-incubator.jar"/>
  <pathelement location="path/to/poi-3.6.jar"/>
  <pathelement location="path/to/poi-scratchpad-3.6.jar"/>
  <pathelement location="path/to/poi-ooxml-3.6.jar"/>
  <pathelement location="path/to/poi-ooxml-schemas-3.6.jar"/>
  <pathelement location="path/to/xmlbeans-2.3.0.jar"/>
  <pathelement location="path/to/dom4j-1.6.1.jar"/>
  <pathelement location="path/to/xml-apis-1.0.b2.jar"/>
  <pathelement location="path/to/geronimo-stax-api_1.0_spec-1.0.jar"/>
  <pathelement location="path/to/tagsoup-1.2.jar"/>
  <pathelement location="path/to/asm-3.1.jar"/>
  <pathelement location="path/to/log4j-1.2.14.jar"/>
  <pathelement location="path/to/metadata-extractor-2.4.0-beta-1.jar"/>
</classpath>

Надеюсь, это поможет вам.

...