Я работаю над solr, чтобы индексировать все типы документов и извлекать содержимое из документа без индексации с помощью командной строки.
Эта нижеприведенная команда, которую я использовал для извлечения файла PDF без индексации к solrCore, и эта же команда прекрасно работает для извлечения файлов 'Html и Xml', но не работает для PDF.
curl "http://localhost:8983/solr/update/extract?&extractOnly=true" --data-binary @"E:/ApacheSolr/solr-6.5.1/example/exampledocs/solr-word.pdf" -H 'Content-type:application/pdf'
Ошибка:
org.apache.solr.common.SolrExceptionorg.apache.solr.common.SolrExceptionURLDecoder: недопустимая цифра (P) в escape (%) pattern400
Заранее спасибо