У меня есть несколько файлов данных в моей папке Hortonworks HDFS.Мое требование - сбросить данные HDFS в оболочку pig, используя режим pig-mapreduce.После загрузки данных файла из HDFS, при попытке выгрузить данные в оболочку pig с помощью команды DUMP, задание сокращения карты застревает на 0% и также не завершает задание в течение длительного времени.Выполните следующие шаги:
1) Запустите pig в режиме mapreduce:
pig -x mapreduce
2) Загрузите данные в pig из каталога HDFS:
mapdata = load 'hdfs://ip-xxx-xx-xx-xx.us-east-2.compute.internal:8020/user/abc/datadir1' as (a:map[chararray]);
3) Печать данных:
dump mapdata;
После выполнения 3-го шага, получая следующие сообщения на оболочке:
2018-10-09 07: 25: 51,099 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - выполнено 0%являются [job_1539066382468_0147]