Если вы используете Nutch как предложенный буфер, на Nutch Wiki есть скрипт, который может вам помочь.Вам просто нужно было бы получить linkdb, crawldb и сегменты из каждой системы на центральный сервер, прежде чем делать это - я думаю, что попытка удаленного доступа к этим ресурсам займет много времени в процессе индексирования.