Я исследую использование DataImportHandler для импорта моих файлов данных, используя
FileDataSource с FileListEntityProcessor и есть пара вопросов
прежде чем я начну, я надеюсь, что вы, ребята, можете помочь с этим.
1) Я хотел бы поместить файл в локальную файловую систему в настроенном
местоположение и пусть Solr увидит и обработает файл без дополнительных усилий
моя часть.
Это выполнимо каким-либо образом? Из того, что я видел, это не поддерживается
и я должен вручную вызвать URL (например,
http://foo/solr/dataimport?command=full-import).
Ручной, основанный на URL метод вызова кажется совершенно логичным в
ориентированный на базу данных мир, где можно запланировать обновление для регулярного запуска
но в моем случае у меня есть пара идентичных индексов, я загружаю баланс между и
не хочу выполнять один и тот же здоровенный запрос несколько раз параллельно. В качестве таких,
Я делаю один запрос, записываю результаты в файл XML, отправляю этот файл
к каждой коробке, а затем желая, чтобы этот файл был обработан. Я хотел бы, чтобы процесс
быть максимально автоматизированным.
2) Я хотел бы, чтобы любые файлы, обработанные Solr, были удалены после того, как они были
импортирован. Я не видел никакого способа сделать это в настоящее время. Я думал, что мог бы быть
возможность подкласса что-то, но FileListEntityProcessor, например,
кажется, не дает никаких ручек в нужное время в рабочем процессе, чтобы удалить
файл. Где-нибудь еще я могу посмотреть?
3) Читая документацию DIH, я наткнулся на следующее утверждение: «Когда
Команда delta-import выполняется, она считывает время начала, сохраненное в conf / dataimport.properties . Он использует эту временную метку для запуска дельта-запросов и
после завершения обновляет отметку времени в conf / dataimport.properties . "Если
он действительно обновляет дату до даты завершения, что происходит с любым
файлы добавлены между начальной и конечной датами? Они потерялись?
4) Для дельта-импорта я не вижу упоминания о порядке обработки обработанных файлов.
кроме этого он пытается не повторно импортировать файлы старше, чем указано в
файл conf / dataimport.properties. В тех случаях, когда порядок имеет значение, делает ли это
упорядочить файлы по имени или дате создания или ...?