Извлечение метаданных с помощью Apache Jackrabbit - PullRequest
1 голос
/ 01 марта 2011

Я немного использовал Alfresco, а над Apache Tika был тонкий слой абстракции для извлечения метаданных из документов.

Я решил использовать только Jackrabbit, потому что мне не нужно такое надежное решение. Но кроме модуля jackrabbit-text-extractors я не вижу никакой другой поддержки метаданных документа (основные свойства Dublin).

Более того, версия 2.0-SNAPSHOT артефакта jackrabbit-text-extractors, похоже, не находится в стволе SVN.

Может кто-нибудь сказать мне, какой подход выбрать?

1 Ответ

1 голос
/ 01 марта 2011

Насколько я понимаю, крольчонок теперь использует тика для извлечения текста

https://issues.apache.org/jira/browse/JCR-1878

...