Я создаю задание mapreduce Hadoop (0.20.1), которое использует HBase (0.20.1) как источник данных, так и приемник данных. Я хотел бы написать работу на Python, которая потребовала от меня использовать hadoop-0.20.1-streaming.jar для потоковой передачи данных в и из моих скриптов Python. Это прекрасно работает, если источником / приемником данных являются файлы HDFS.
Поддерживает ли Hadoop потоковую передачу из / в HBase для mapreduce?