Question

По моим выводам, запуск нескольких sparksqls с разными группами заданий не помещает их в указанные группы. https://issues.apache.org/jira/browse/SPARK-29340

Создание новой потоковой рабочей группы работает для заданий с плавающей точкой в данных, но не для sparksql. Есть ли способ поместить все выполнения локальных потоков SQL в отдельную рабочую группу?

val sparkThreadLocal: SparkSession = DataCurator.spark.newSession()

sparkThreadLocal.sparkContext.setJobGroup("<id>", "<description>")

OR

sparkThreadLocal.sparkContext.setLocalProperty("spark.job.description", "<id>")
sparkThreadLocal.sparkContext.setLocalProperty("spark.jobGroup.id", "<description>")

Navdeep Poonia · Answer 1 · 04 октября 2019

Решено! Это была проблема с использованием параллельной итерации scala, которая использует пулы потоков.

Используются ли в Spark Sql локальные рабочие группы потока?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Используются ли в Spark Sql локальные рабочие группы потока?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов