Режим Pig on mapreduce застревает при сбросе данных hdfs в Hortonworks HDP - PullRequest
0 голосов
/ 10 октября 2018

У меня есть несколько файлов данных в моей папке Hortonworks HDFS.Мое требование - сбросить данные HDFS в оболочку pig, используя режим pig-mapreduce.После загрузки данных файла из HDFS, при попытке выгрузить данные в оболочку pig с помощью команды DUMP, задание сокращения карты застревает на 0% и также не завершает задание в течение длительного времени.Выполните следующие шаги:

1) Запустите pig в режиме mapreduce:

pig -x mapreduce

2) Загрузите данные в pig из каталога HDFS:

mapdata = load 'hdfs://ip-xxx-xx-xx-xx.us-east-2.compute.internal:8020/user/abc/datadir1' as (a:map[chararray]);

3) Печать данных:

dump mapdata;

После выполнения 3-го шага, получая следующие сообщения на оболочке:

2018-10-09 07: 25: 51,099 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - выполнено 0%являются [job_1539066382468_0147]

...