Как я могу интегрировать Тику в мой проект Lucene? - PullRequest
1 голос
/ 06 сентября 2011

Я хочу интегрировать Apache Tika в мой проект Java. Мне нужно получить текст из разных форматов файлов (Excel, DOC, PPT и многое другое ..) После некоторого прочтения я понимаю, что единственный способ собрать tika - это загрузить файл src и собрать его с помощью Maven. Я выполняю "mvn install" в корневом каталоге Tika src (apache-tika-0.9-src), но получаю эту ошибку:

[INFO] Scanning for projects...
Downloading: http://repo1.maven.org/maven2/org/apache/apache/6/apache-6.pom
[ERROR] The build could not read 1 project -> [Help 1]
[ERROR]
[ERROR]   The project org.apache.tika:tika:0.9 (C:\Users\vexler\Documents\Instal
ls\apache-tika-0.9-src\apache-tika-0.9\pom.xml) has 1 error
[ERROR]     Non-resolvable parent POM for org.apache.tika:tika-parent:0.9: Could
 not transfer artifact org.apache:apache:pom:6 from/to central (http://repo1.mav
en.org/maven2): Error transferring file: Connection timed out: connect and 'pare
nt.relativePath' points at no local POM @ org.apache.tika:tika-parent:0.9, C:\Us
ers\vexler\Documents\Installs\apache-tika-0.9-src\apache-tika-0.9\tika-parent\po
m.xml, line 25, column 11 -> [Help 2]

Я действительно ценю любую помощь с этой ошибкой. Спасибо :-) Reuth

1 Ответ

1 голос
/ 06 сентября 2011

Если вы используете Maven в своем проекте, тогда жизнь намного проще

Просто добавьте что-то вроде

<dependency>
   <groupId>org.apache.tika</groupId>
   <artifactId>tika-parsers</artifactId>
   <version>0.9</version>
   <scope>provided</scope>
 </dependency>

И тогда Maven загрузит Тику и ее зависимости для вас

Кроме того, если вы скачаете последнюю Tika OSGi Bundle Jar (например, 0.9 ) и распакуете ее, то вы получите зависимости Tika и код в этом

...