Пользовательский интерфейс работает на компьютере драйвера.Поэтому, если у машины заканчивается ОЗУ, пользовательский интерфейс работает очень медленно.
Здесь я вижу, что вы запрашиваете 12 ГБ ОЗУ для драйвера.Это много, и если это вся память, доступная на машине, то имеет смысл, что в какой-то момент интерфейс становится очень медленным.Предполагается, что этот процесс только запускает вычисления и делит их между рабочими.
Я предполагаю, что вы собираете большой объем данных, что, как правило, не очень хорошая идея.(см. https://databricks.gitbooks.io/databricks-spark-knowledge-base/content/best_practices/dont_call_collect_on_a_very_large_rdd.html)
Лучше было бы записать СДР в файл или в распределенную БД.