Question

Я хочу индексировать документы pdf всякий раз, когда они загружаются приложением. Во время индексации я отправляю filename и fileType в url, как следует

http://localhost:8983/solr/update/extract?stream.file=/D:\apache-solr-3.3.0\example\exampledocs\Accessing_MySQL_from_IntalioBPMS.pdf&stream.contentType=application/pdf&literal.id=111&literal.fileName=Test.pdf&literal.fileType=pdf&commit=true

В моем файле schema.xml также есть поля fileName и fileType.

После того, как я проиндексировал pdf-документы, я выполняю поиск, он показывает только content и id документа pdf, но не filename и filetype.

Что я делаю не так?

smerchek · Answer 1 · 08 сентября 2011

Когда вы определяете свою схему, вы должны указать, какие поля будут сохраняться (или извлекаться при поиске). В этом случае вполне вероятно, что поля вашего имени файла и типа файла только проиндексированы и не сохранены.

Убедитесь, что ваша схема похожа на следующую:

<field name="filename" type="{yourDesiredType}" indexed="true"stored="true"/> <field name="filetype" type="{yourDesiredType}" indexed="true"stored="true"/>

Для получения дополнительной информации о редактировании schema.xml, перейдите к http://wiki.apache.org/solr/SchemaXml.

Apache Solr PDF индексация

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Apache Solr PDF индексация

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов