У меня медленная работа в приложении pyspark.
У меня есть функция, которая включает в себя 5 фреймов данных, и есть соединения и соглашения внутри.
Когда я вызываю эту функцию только один раз, она запускается успешно.
Но когда я вызываю его более одного раза, внутри процесса (только меняя параметр, но объем данных остается неизменным), он не завершается.
Это останавливается в некоторой части, которую я не могу идентифицировать.
Мой вопрос: как отладить мое искровое приложение, чтобы определить это узкое место?