Вы можете начать писать свой собственный Mapper и Reducer, следуя Link , предоставленному @Moiz Arafat.
После этого сделайте из него баночку (скажем, myjar.jar).
Для работы таких пользовательских Mapper и Reducer требуется hive-contrib.jar, который можно найти в папке lib вашей установки куста.
Перед запуском запроса, который использует эти Mapper / Reducer, вы должны добавить эти две банки в куст.
hive> add file path/to/hive-contrib.jar;
hive> add file path/to/myjar.jar;
Пожалуйста, используйте добавить файл и НЕ добавить банку .
Теперь вы можете написать свой запрос как:
hive> FROM (
FROM src
MAP inkey, inval
USING 'java -cp myjar.jar:hive-contrib.jar com.myco.mymr.MyMapper'
AS k, v
CLUSTER BY k) mapout
REDUCE k, v
USING 'java -cp myjar.jar:hive-contrib.jar com.myco.mymr.MyReducer'