Question

Я использую Solrj для индексации PDF-файлов с помощью SOLR, но некоторые файлы не могут индексироваться и делают исключение

GRAVE: Error: Could not parse predefined CMAP file for 'Adobe-Identity-UCS'
java.lang.NoSuchMethodError: org.apache.fontbox.cmap.CMap.lookup(II)Ljava/lang/String;

Можете ли вы сказать мне, в чем проблема?Спасибо

Jayendra · Answer 1 · 27 сентября 2011

Кажется, что есть некоторые несоответствия с jar-файлами шрифтов apache, в которых упоминается, что метод не найден.
Можете ли вы подтвердить, что jar-файлы для tika и всех ее зависимостей синхронизированы и являются теми, которые включены в сборку.
Вы также можете проверить автономно, если синтаксический анализ документов работает нормально, используя jars проекта Apache Tika.

Индексирование PDF-файла с помощью SOLR

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Индексирование PDF-файла с помощью SOLR

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов