Почему только одно ядро ​​берет на себя всю нагрузку, как заставить другие 29 ядер брать нагрузку? - PullRequest
0 голосов
/ 23 ноября 2018

Я пытаюсь отправить обработанные Spark данные в кластер с 3 узлами C *.Я отправляю 200 миллионов записей на Cassandra, с ошибкой ниже которой. Err.

Под ней моя конфигурация искрового кластера

Nodes : 12
vCores Total : 112
Total memory : 1.5 TB.
Below are my spark-sumbit parameters:

$SPARK_HOME/bin/spark-submit 
--master yarn 
--deploy-mode cluster 
--name app 
--class Driver 
--executor-cores 3 
--executor-memory 8g 
--num-executors 10 
--driver-cores 2 
--driver-memory 10g 
--conf spark.shuffle.service.enabled=true 
--conf spark.dynamicAllocation.enabled=false 
--conf spark.task.maxFailures=8  
--conf spark.ui.killEnabled=false 
 oracle2c.jar 

Я сделал разделы кадра данных Spark 30, как показано ниже

+--------------------+-------+
|SPARK_PARTITION_ID()|  count|
+--------------------+-------+
|                  22|6687176|
|                  29|6687175|
|                   8|6687176|
|                  21|6687176|
|                  23|6687176|
|                   5|6687176|
|                   9|6687176|
|                  17|6687176|
|                  26|6687175|
|                  27|6687175|
|                   4|6687176|
|                  10|6687176|
|                  18|6687176|
|                  25|6687175|
|                   1|6687176|
|                  20|6687176|
|                  12|6687176|
|                  28|6687175|
|                  24|6687176|
|                  15|6687176|
|                  14|6687176|
|                   6|6687176|
|                  19|6687176|
|                   0|6687175|
|                   3|6687176|
|                  11|6687176|
|                   2|6687176|
|                   7|6687176|
|                  13|6687176|
|                  16|6687176|
+--------------------+-------+

Но когда я запускаю работу, я вижу, что в executor работает только одно ядро, как заставить все ядра участвовать в распределении нагрузки?

enter image description here

Какие еще параметры конфигурации мне нужно добавить, чтобы все ядра приняли нагрузку?

...