У меня есть коллекция тысяч документов / PDF, и есть много полей, таких как: URL, заголовок, дата ... и т. Д. Но здесь нет поля для контента, которое выглядит так, как будто оно должно существовать, чтобы вы могли осуществлять поиск по ключевым словам всего документа, а не только по названию. Я вижу, что некоторые люди говорят, что обычно поле контента генерируется автоматически при индексации.
Как мне добавить поле содержимого, которое должно содержать весь текст в PDF / DOC? Я нахожусь на Solr 6, поэтому я знаю, что мне нужно использовать API для создания нового поля для работы с управляемой схемой. Но после этого, как мне переиндексировать мою коллекцию? И если я просто назову новое поле «контент», узнает ли Солр, что поле «контент» должно содержать весь текст в моих файлах PDF / DOC при его переиндексации?