Maven-shade tika-app возвращает пустую строку - PullRequest
0 голосов
/ 28 февраля 2019

Я использовал tika-app-1.20.jar для извлечения метаданных и содержимого из файлов.Причина, по которой я заштриховал Tika, заключалась в том, чтобы удалить конфликтующие друг с другом зависимости в проекте, который уже был построен.

Затененный jar отлично работает, без проблем импорта с новыми затененными именами, но затем возвращается «EmptyParser»для всех файлов, которые не приводят к анализу содержимого.

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>

  <groupId>com.test1.tika</groupId>
  <artifactId>tika-app</artifactId>
  <version>1.20</version>
  <packaging>jar</packaging>

  <name>tika-app</name>
  <url>http://maven.apache.org</url>

  <properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
  </properties>

  <dependencies>
    <dependency>
      <groupId>junit</groupId>
      <artifactId>junit</artifactId>
      <version>3.8.1</version>
      <scope>test</scope>
    </dependency>
    <dependency>
        <groupId>org.apache.tika</groupId>
        <artifactId>tika-app</artifactId>
        <version>1.20</version>
    </dependency>
  </dependencies>


  <build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-compiler-plugin</artifactId>
            <version>2.3</version>
            <configuration>
                <source>1.6</source>
                <target>1.6</target>
            </configuration>
        </plugin>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-shade-plugin</artifactId>
            <version>3.2.1</version>
            <configuration>
                <createSourcesJar>true</createSourcesJar>
        <relocations>
          <relocation>
            <pattern>org.apache.tika</pattern>
            <shadedPattern>com.test1.tika</shadedPattern>
          </relocation>
        </relocations>

        <filters>
          <filter>
              <artifact>*:*</artifact>
              <excludes>
                  <exclude>META-INF/*.SF</exclude>
                  <exclude>META-INF/*.RSA</exclude>
                  <exclude>META-INF/*.DSA</exclude>
              </excludes>
          </filter>
      </filters>
            </configuration>
            <executions>
                <execution>
                    <phase>package</phase>
                    <goals>
                        <goal>shade</goal>
                    </goals>
                </execution>
            </executions>
        </plugin>
    </plugins>
</build>

</project>

Я удалил DSA .SF, .RSA, *, чтобы удалить недопустимую ошибку дайджеста подписи.Моя интуиция заключается в том, что в этом процессе удаляется некоторый файл свойств, который сопоставляет анализатор с типом файла.

...