Apache Solr PDF индексация - PullRequest
       2

Apache Solr PDF индексация

0 голосов
/ 08 сентября 2011

Я хочу индексировать документы pdf всякий раз, когда они загружаются приложением. Во время индексации я отправляю filename и fileType в url, как следует

http://localhost:8983/solr/update/extract?stream.file=/D:\apache-solr-3.3.0\example\exampledocs\Accessing_MySQL_from_IntalioBPMS.pdf&stream.contentType=application/pdf&literal.id=111&literal.fileName=Test.pdf&literal.fileType=pdf&commit=true

В моем файле schema.xml также есть поля fileName и fileType.

После того, как я проиндексировал pdf-документы, я выполняю поиск, он показывает только content и id документа pdf, но не filename и filetype.

Что я делаю не так?

1 Ответ

1 голос
/ 08 сентября 2011

Когда вы определяете свою схему, вы должны указать, какие поля будут сохраняться (или извлекаться при поиске). В этом случае вполне вероятно, что поля вашего имени файла и типа файла только проиндексированы и не сохранены.

Убедитесь, что ваша схема похожа на следующую:

<field name="filename" type="{yourDesiredType}" indexed="true"stored="true"/> <field name="filetype" type="{yourDesiredType}" indexed="true"stored="true"/>

Для получения дополнительной информации о редактировании schema.xml, перейдите к http://wiki.apache.org/solr/SchemaXml.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...