Я использую Python и должен работать по следующему сценарию, используя Hadoop Streaming:
а) Map1-> Reduce1-> Map2-> Reduce2
б) я не хочу хранить промежуточные файлы
в) Я не хочу устанавливать такие пакеты, как Cascading, Yelp, Oozie. Я сохранил их как последний вариант.
Я уже проходил такую же дискуссию о SO и в других местах, но не смог найти ответ по Python. Можете ли вы предложить.