Как указать типы файлов при индексации Solr - PullRequest
0 голосов
/ 01 ноября 2019

Я проиндексировал каталог папок / файлов, содержащих html-страницы, документы, ppts, pdfs..etc. Я заметил тип файла с именем LOG, который индексируется, и я не хочу, чтобы он был проиндексирован, потому что содержимое не требуется.

Чтобы проиндексировать Solr, я использовал эту команду (япользователь Windows, поэтому я использую простой инструмент post): java -Dc=collection -Dport=4983 -Drecursive -Dauto jar example/exampledocs/post.jar c:/folder Вместо этого я попытался выполнить следующую команду, чтобы исключить файлы LOG:

java -Dc=collection -Dport=4983 -Drecursive -Dfiletypes=xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt jar example/exampledocs/post.jar c:/folder

Solr отказывается индексировать и выдает ошибки (# 400 http). Типы файлов должны быть реальной командой, которую я могу использовать, но Solr, похоже, это не нравится. Я даже попытался [] по списку типов файлов, и это не будет работать. Мой синтаксис неверен?

1 Ответ

0 голосов
/ 06 ноября 2019

Если я добавлю -Dauto, он работает!

java -Dc=collection -Dport=4983 -Drecursive -Dauto -Dfiletypes=xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt jar example/exampledocs/post.jar c:/folder
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...