Задание прервано из-за сбоя этапа: ShuffleMapStage 20 (перераспределение в data_prep.scala: 87) не удалось максимально допустимое количество раз: 4 - PullRequest
0 голосов
/ 04 июля 2019

Я отправляю задание Spark со следующей спецификацией: (одна и та же программа использовалась для запуска другого размера диапазона данных от 50 до 400 ГБ)

/usr/hdp/2.6.0.3-8/spark2/bin/spark-submit 
 --master yarn 
 --deploy-mode cluster 
 --driver-memory 5G 
 --executor-memory 10G 
 --num-executors 60
 --conf spark.yarn.executor.memoryOverhead=4096 
 --conf spark.shuffle.registration.timeout==1500 
 --executor-cores 3 
 --class classname /home//target/scala-2.11/test_2.11-0.13.5.jar

Я пытался восстановить данные во время чтения, а также применилВозмещение ущерба перед выполнением любого подсчета с помощью клавиши на СДР:

val rdd1 = rdd.map(x=>(x._2._2,x._2._1)).distinct.repartition(300)
val receiver_count=rdd1.map(x=>x._2).distinct.count

Исключение класса пользователя:

org.apache.spark.SparkException: Job aborted due to stage failure: ShuffleMapStage 20 (repartition at data_prep.scala:87) has failed the maximum allowable number of times: 4. Most recent failure reason: org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle 9

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...