Это, безусловно, выполнимо.Возможно, вам будет удобнее работать с Hadoop Streaming .Как сказано на этом сайте:
Потоковая передача Hadoop - это утилита, поставляемая с дистрибутивом Hadoop.Утилита позволяет создавать и запускать сопоставления / сокращения заданий с любым исполняемым файлом или сценарием в качестве сопоставителя и / или редуктора.
Я склонен начинать с внешнего кода внутри потоковой передачи Hadoop.В зависимости от вашего языка, есть много хороших примеров того, как использовать его в потоковом режиме;Как только вы попадаете на свой язык, вы можете при желании передать данные в другую программу.У меня было несколько слоев программ на разных языках, играющих без особых усилий, чем если бы я запускал его на обычном Linux-компьютере, за исключением того, что внешний слой работал с Hadoop Streaming.