Это вопрос новичка Solr - тем не менее, для меня очень важно понять, как работает Solr и подходит ли он для проекта.
Я хочу индексировать двоичные документы, то есть документы MS-Office и PDF-файлы.Я понимаю, что Solr может индексировать содержимое этих документов, и я могу создавать запросы для получения значений и полей, которые я в результате возвращаю.Мой вопрос: что происходит с PDF (или любым документом) после его сканирования?На самом ли деле он сохранен или полностью удален, и могу ли я получить ссылку / ссылку на исходный документ вкл.местоположение (путь) назад от solr или я должен передать эту информацию во время подачи документа?
Может кто-нибудь помочь мне понять это, пожалуйста?