Читать документы с Elasti c Поиск - PullRequest
0 голосов
/ 22 января 2020

У меня есть задание по поиску информации, где я должен использоватьasticSearch для генерации индексации / ранжирования. Мне удалось загрузитьasticSearch, и теперь он работает на http://localhost:9200/, но как мне прочитать все документы, хранящиеся в моей папке с именем 'data'?

1 Ответ

1 голос
/ 23 января 2020

Elasticsearch - это просто поисковая система. Чтобы ваши документы и файлы были доступны для поиска, вам необходимо загрузить их, извлечь все соответствующие данные и загрузить вasticsearch.

Apache Tika - это решение для извлечения данных из файлы. Напишите сканер файловой системы, используя Tika. Затем используйте Rest API для индексации данных.

Если вы не хотите заново изобретать колесо, взгляните на проект FSCrawler . Здесь - это блог, описывающий, как решить стоящую перед вами задачу.

Удачи!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...