Я получил доступ к группе управляемых ресурсов блока данных со всеми внутренне созданными ресурсами (например, виртуальные машины, диски и сетевые интерфейсы) .
Там я проверил показатели потребления ЦПдля каждого из моих работников.Вот результат для кластера 2x Worker :
Вот тот же график, показывающий момент, когда задачи наконец-то закончились:
На основе этих метрик мы можем видеть, что:
- Среднее использование ЦП составляет 85 ~ 87%
- Максимальное использование процессора составляет 92 ~ 96%
- Минимальное использование процессора составляет 70 ~ 80%
Эти показатели подходят для моего варианта использования ... Но если кто-нибудьесть какие-либо подсказки о том, как использовать spark-submit
с Databricks, пожалуйста, не стесняйтесь поделиться новым ответом здесь.