В качестве лучшей практики я пытаюсь индексировать пачку документов в Solr за один запрос, а не индексировать по одному. Теперь у меня проблема с тем, что индексируемые файлы имеют разные типы (pdf, word document, text file, ...) и поэтому имеют разные метаданные, которые извлекаются из Tika и индексируются.
Я хотел бы иметь определенные поля / информацию для всех файлов, независимо от их типа, например, создатель, дата создания и путь, но я не знаю, как вручную добавлять поля, когда я индексирую все файлы одновременно.
Если бы я индексировал один файл за раз, я мог бы просто добавить поля с помощью request.setParam (), но это для всего запроса, а не для одного файла. И даже если что-то подобное возможно, как я могу получить информацию о создателе файла на Java?
Есть ли возможность добавлять поля для каждого файла?
if(listOfFiles != null) {
for (File file : listOfFiles) {
if (file.isFile()) {
request.addFile(file, getContentType(file));
//add field only for this file?
}else{
//Folder, call the same method again -> recursion
request = addFilesToRequest(file, request);
}
}
}