Solr curl ExtractOnly для PDF-файла - PullRequest
       26

Solr curl ExtractOnly для PDF-файла

0 голосов
/ 05 сентября 2018

Я работаю над solr, чтобы индексировать все типы документов и извлекать содержимое из документа без индексации с помощью командной строки.

Эта нижеприведенная команда, которую я использовал для извлечения файла PDF без индексации к solrCore, и эта же команда прекрасно работает для извлечения файлов 'Html и Xml', но не работает для PDF.

curl "http://localhost:8983/solr/update/extract?&extractOnly=true"  --data-binary @"E:/ApacheSolr/solr-6.5.1/example/exampledocs/solr-word.pdf"  -H 'Content-type:application/pdf'

Ошибка: org.apache.solr.common.SolrExceptionorg.apache.solr.common.SolrExceptionURLDecoder: недопустимая цифра (P) в escape (%) pattern400

Заранее спасибо

...