Я пытаюсь запустить очень простой скрипт на Python с помощью кустов и Hadoop.
Это мой сценарий:
#!/usr/bin/env python
import sys
for line in sys.stdin:
line = line.strip()
nums = line.split()
i = nums[0]
print i
И я хочу запустить его в следующей таблице:
hive> select * from test;
OK
1 3
2 2
3 1
Time taken: 0.071 seconds
hive> desc test;
OK
col1 int
col2 string
Time taken: 0.215 seconds
Я бегу:
hive> select transform (col1, col2) using './proba.py' from test;
Но всегда получается что-то вроде:
...
2011-11-18 12:23:32,646 Stage-1 map = 0%, reduce = 0%
2011-11-18 12:23:58,792 Stage-1 map = 100%, reduce = 100%
Ended Job = job_201110270917_20215 with errors
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
Я пробовал много разных модификаций этой процедуры, но постоянно терпел неудачу. (
Я что-то не так делаю или есть проблема с установкой моего улья / hadoop?