У меня есть кодовая база python, которая использует pyspark SparkSession.builder
для создания SparkSession
.Я нахожусь в точке, где я хочу профилировать код Python, который выполняется.
Если бы я вызывал конструктор SparkContext
напрямую, я мог бы передать параметр profiler_cls
. Однакос помощью компоновщика, похоже, не существует способа сделать это.Я что-то пропустил?На данный момент это будет значение по умолчанию BasicProfiler
, но я хочу использовать https://pypi.org/project/pyspark-flame/.
Любая помощь будет принята с благодарностью.
Урезанная версия кода (удаление лишнихнастройки конфигурации):
SparkSession.builder.master(master).appName(app_name) \
.config("spark.driver.maxResultSize", "4g") \
.config("spark.python.profile", "true") \
.config("spark.python.profile.dump", ".") \
.getOrCreate()
Я пытаюсь сделать это с помощью компоновщика, а не реализовывать этот код самостоятельно.