Мне интересно, можем ли мы использовать Обработчик импорта данных для индексации документов HTML.
Я пытался импортировать документы, но получаю следующее сообщение:
Indexing completed. Added/Updated: 0 documents. Deleted 0 documents.
Requests: 0, Fetched: 1,213, Skipped: 0, Processed: 0
Не знаю, почему документы не индексируются.
data-config.xml:
<dataConfig>
<dataSource type="FileDataSource" />
<document>
<entity name="f" processor="FileListEntityProcessor" baseDir="/var/www/html/" fileName=".*html" recursive="true" rootEntity="false" dataSource="null">
<entity name="html" processor="LineEntityProcessor"
url="${f.fileAbsolutePath}" format="html">
<field column="id" name="id" />
<field column="title" name="title" meta="true"/>
</entity>
</entity>
</document>
</dataConfig>
управляемая схема:
<field name="title" type="strings"/>
Пожалуйста, помогите мне.