Я немного использовал Alfresco, а над Apache Tika был тонкий слой абстракции для извлечения метаданных из документов.
Я решил использовать только Jackrabbit, потому что мне не нужно такое надежное решение. Но кроме модуля jackrabbit-text-extractors я не вижу никакой другой поддержки метаданных документа (основные свойства Dublin).
Более того, версия 2.0-SNAPSHOT артефакта jackrabbit-text-extractors, похоже, не находится в стволе SVN.
Может кто-нибудь сказать мне, какой подход выбрать?