Я использую DIH для индексации локальной файловой системы. Но путь к файлу, размер и поле последнего изменения не были сохранены. в schema.xml я определил:
<fields>
<field name="title" type="string" indexed="true" stored="true"/>
<field name="author" type="string" indexed="true" stored="true" />
<!--<field name="text" type="text" indexed="true" stored="true" />
liang added-->
<field name="path" type="string" indexed="true" stored="true" />
<field name="size" type="long" indexed="true" stored="true" />
<field name="lastmodified" type="date" indexed="true" stored="true" />
</fields>
А также определил tika-data-config.xml:
<dataConfig>
<dataSource name="bin" type="BinFileDataSource" />
<document>
<entity name="f" dataSource="null" rootEntity="false"
processor="FileListEntityProcessor"
baseDir="E:/my_project/ecmkit/infotouch"
fileName=".*\.(DOC)|(PDF)|(pdf)|(doc)|(docx)|(ppt)" onError="skip"
recursive="true">
<entity name="tika-test" dataSource="bin" processor="TikaEntityProcessor"
url="${f.fileAbsolutePath}" format="text" onError="skip">
<field column="Author" name="author" meta="true"/>
<field column="title" name="title" meta="true"/>
<!--
<field column="text" name="text"/> -->
<field column="fileAbsolutePath" name="path" />
<field column="fileSize" name="size" />
<field column="fileLastModified" name="lastmodified" />
</entity>
</entity>
</document>
</dataConfig>
Версия Solr - 3.5. есть идеи?
Заранее спасибо.