Как я могу сделать Apache Tika индексировать каталог PDF и текстовые файлы, включая подкаталоги, и отправить его в Apache Solr, чтобы я мог иметь поисковую систему для содержимого этого каталога?
Любой совет, связанный сWindows или Linux это не имеет значения.Я не смог заставить это работать, потому что документация по этим двум проектам в основном предназначена для разработчиков, и это хорошо, но, тем не менее, я не могу заставить их сделать это, потому что документация расплывчата и недостаточно ясна для не Javadeveloper.
Очень просто: как мне создать поисковик, используя семейство проектов Apache Lucene, которое может индексировать и обеспечивать поиск для / home / material или c: / material или / cygdrive / c /материал
Заранее большое спасибо