Похоже, что только индексы NUTCH (некоторые) анализируют результаты.Он запускает фильтры индексации, которые определяют, что индексируется.
Эти фильтры индексации получают результат анализа в качестве параметра.
Как можно получить имена файлов и другие метаданные файла, например, индексируемого владельца?1005 *
Конечно, мне нужно добавить индексный фильтр, но для этого мне также нужно добавить парсер для анализа всех типов файлов и получения их метаданных?