В двух словах: у hadoop есть множество других плагинов, кроме картографов и редукторов: объединители, компараторы форматов ввода / вывода. Эти плагины могут быть написаны только на Java.
Таким образом, это означает, что использование hadoop через потоковую передачу может подойти для некоторых простых случаев, но серьезно снизит вашу гибкость.
Потоковая передача также несколько медленнее, поскольку для передачи записей в преобразователи и преобразователи используются различные механизмы.