Elasticsearch - это просто поисковая система. Чтобы ваши документы и файлы были доступны для поиска, вам необходимо загрузить их, извлечь все соответствующие данные и загрузить вasticsearch.
Apache Tika - это решение для извлечения данных из файлы. Напишите сканер файловой системы, используя Tika. Затем используйте Rest API для индексации данных.
Если вы не хотите заново изобретать колесо, взгляните на проект FSCrawler . Здесь - это блог, описывающий, как решить стоящую перед вами задачу.
Удачи!