Я индексирую документы с форматированным текстом в SOLR 3.4, используя ExtractingRequestHandler
, и у меня возникают проблемы с тем, чтобы заставить его вести себя так, как я хочу.
Я хотел бы сохранить дату создания как поле дляпозже используйте для фасетного поиска и определили следующее в schema.xml
:
<field name="creation_date" type="date" indexed="true" stored="true"/>
I индекс, как это:
curl -s "http://localhost:8983/solr/update/extract?literal.id=myid&resource.name=myfile.xls&commit=true" -F myfile=@/path/to/myfile.xls
Я получаю динамическое поле attr_creation_date
(что другие правилаубедитесь), но я не понимаю, как creation_date
.Я также безуспешно пытался использовать copyField
примерно так:
<copyField source="attr_creation_date" dest="creation_date"/>
Еще одна попытка заключалась в том, чтобы поместить это в solrconfig.xml
, но не повезло:
<str name="fmap.Creation-Date">creation_date</str>
Я довольноконечно, я упускаю что-то простое здесь.Любая помощь наиболее ценится!
Настройки для ExtractingRequestHandler
в solrconfig.xml
:
<requestHandler name="/update/extract" startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="fmap.content">text</str>
<str name="fmap.Last-Save-Date">last_save_date</str>
<str name="fmap.Creation-Date">creation_date</str>
<str name="fmap.Content-Type">content_type</str>
<str name="lowernames">true</str>
<str name="uprefix">attr_</str>
<str name="captureAttr">true</str>
<str name="fmap.a">links</str>
</lst>
</requestHandler>
Мой schema.xml
файл (много материала по умолчанию): https://gist.github.com/1358002