Добавьте это в свой блокнот и затем нажмите на ссылку после выполнения ячейки. Затем вы можете отслеживать прогресс того, что выполняется, и видеть, какие операторы вызывают его замедление. Вы также можете разбить код на несколько ячеек, чтобы увидеть, где происходит замедление.
from IPython.core.display import display, HTML
#sc = SparkContext.getOrCreate()
from pyspark import SparkContext
sc =SparkContext()
spark_url = sc.uiWebUrl
display(HTML('''
<p>
<br />Spark connection is ready! Use this URL to monitor your Spark application!
</p>
<p>
<a href="{spark_url}">{spark_url}</a>
</p>'''.format(spark_url=spark_url)))