Мой подход,
Сконфигурировал программу редукции карт для использования 16 редукторов, поэтому окончательный вывод состоял из 16 файлов (от-00000 до-00015) объемом 300+ МБ, а ключи были отсортированы водин и тот же порядок для обоих входных файлов.
Теперь на каждом этапе я читал 2 входных файла (около 600 МБ) и выполнял обработку. Поэтому на каждом этапе мне приходилось хранить в памяти до 600 МБ, чтосистема может очень хорошо управлять.
Программа была довольно быстрой и заняла около 20 минут для полной обработки.
Спасибо за все предложения! Я ценю вашу помощь