Мы используем Nutch для сканирования нашего сайта в интрасети.
Мы извлекаем метаданные в файле XML, на этапе индексации (мы изменили код indexer.java) и при запуске в локальном режиме.он дал нам необходимые метаданные.
Теперь мы подумали об использовании Nutch в режиме кластера (используя Hadoop), когда мы сканировали Nutch в кластере, мы можем получить индекс, но не метаданные, которые мы использовали дляполучить ранее, в локальном режиме мы использовали (классы ввода-вывода Java для записи мета в файлы).Для hadoop мы изменили это на классы файловой системы hadoop io.Но мы не можем получить мету.
Есть ли какое-то решение или мы что-то упустили?
Заранее спасибо, Гео