Как индексировать имена файлов (и другие метаданные файлов) в Nutch? - PullRequest
0 голосов
/ 09 февраля 2012

Похоже, что только индексы NUTCH (некоторые) анализируют результаты.Он запускает фильтры индексации, которые определяют, что индексируется.

Эти фильтры индексации получают результат анализа в качестве параметра.

Как можно получить имена файлов и другие метаданные файла, например, индексируемого владельца?1005 *

Конечно, мне нужно добавить индексный фильтр, но для этого мне также нужно добавить парсер для анализа всех типов файлов и получения их метаданных?

1 Ответ

0 голосов
/ 03 апреля 2012

Детали (имена файлов, владелец) уже будут обрабатываться кодом, но я думаю, что вам нужно внести небольшие изменения в парсеры, чтобы сохранить эти детали

...