Я хочу создать мини-поисковую систему на основе изображений, для которой я могу предоставить файл изображения, и он будет искать похожие изображения в solr. Я использую Nutch для сканирования и индексации данных в Solr. Я сделал изменения в Nutch Conf файлы, такие как -
- Добавлено
image/*
в mimetype-filter.txt
- Удалены расширения изображений из
suffix-urlfilter.txt
- чтобы не пропускать их
Я также добавил поля в solr schema.xml -
<field name="name" type="string" indexed="true" stored="true" />
<field name="iso" type="string" indexed="true" stored="true" multiValued="true" />
<field name="iso_string" type="string" indexed="true" stored="true" multiValued="true" />
<field name="aperture" type="double" indexed="true" stored="true" />
<field name="exposure" type="string" indexed="true" stored="true" />
<field name="exposure_time" type="double" indexed="true" stored="true" />
<field name="focal" type="string" indexed="true" stored="true" />
<field name="focal_35" type="string" indexed="true" stored="true" />
<dynamicField name="ignored_*" type="string" indexed="false" stored="false" multiValued="true" />
Но когда я сканирую, нет данных, которые индексируются в solr. Я не могу найти какую-либо документацию / учебник по этому вопросу. Я также просмотрел несколько постов по stackoverflow для сканирования изображений с использованием Nutch. Но я не нашел их полезными.
Может кто-нибудь, пожалуйста, направить меня в правильном направлении относительно того, как действовать? Заранее спасибо.