чтобы разобрать html в строку, я использовал тика парсер, но я столкнулся с некоторыми проблемами, такими как библиотеки и ошибки в jdeveloper - PullRequest
0 голосов
/ 29 марта 2011

Во-первых, мне нужно скачать tika-bundle-0.9.jar, но я не могу его найти. Вскоре я написал эти

 try {
        URL itemURL = new URL("");
        DataInputStream daHTMLfromDaItem = new DataInputStream(itemURL.openStream());
        Tika tika = new Tika();
        Metadata metadata = new Metadata();
        Reader reader = tika.parse(daHTMLfromDaItem, metadata);

          String s=reader.toString();
          //System.out.print(s);


    } catch (Exception e) {
        e.printStackTrace();
    }

ошибка

Error(5,24): cannot access class org.apache.tika.Tika; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(6,33): cannot access class org.apache.tika.metadata.Metadata; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(15,13): class Tika not found in class mypackage.TikaParsing

Error(15,29): class Tika not found in class mypackage.TikaParsing

Error(16,13): class Metadata not found in class mypackage.TikaParsing

Error(16,37): class Metadata not found in class mypackage.TikaParsing

Кроме того, я должен сказать, что добавил все необходимые библиотеки, кроме tika-bundle-0.9.jar. Возникают ли некоторые проблемы из-за tika-bundle-0.9.jar и как я могу найти tika-bundle-0.9.jar? Я не могу найти решение.

Спасибо

Ответы [ 2 ]

1 голос
/ 29 марта 2011

Библиотеки tika были скомпилированы с Java 1.5, но вы пытаетесь запустить их в среде Java 1.4. Вот что говорит нам первое сообщение об ошибке. Версия 49.0 генерируется Java 1.5, Версия 48.0 Java 1.4.x

Либо запустите ваше приложение с Java 1.5+, либо попробуйте найти старую версию tika, совместимую с Java 1.4.2

0 голосов
/ 31 марта 2011

Комплект Тика доступен от Maven. Если вы используете maven, добавьте что-то вроде:

<dependencies>
 <dependency>
   <groupId>org.apache.tika</groupId>
   <artifactId>tika-bundle</artifactId>
   <version>0.9</version>
   <scope>provided</scope>
 </dependency>
<dependencies>

Если вы не используете Maven, возьмите его вручную из ближайшего репозитория Maven, например, http://repo1.maven.org/maven2/org/apache/tika/tika-bundle/ (каждая версия находится в своем собственном подкаталоге)

...