Эй, рад, что вы здесь, в сообществе,
Подсчет - это ленивая операция. Подсчет, покажите, что все эти операции стоят дорого, поскольку они работают над каждой записью, поэтому их использование всегда будет занимать много времени.вместо этого вы можете записать результаты обратно в файл или базу данных, чтобы сделать это быстрее, если вы хотите проверить результат, вы можете использовать DF.printSchema()
Простой способ проверить, есть ли в кадре данных строки, это сделать Try(df.head)
.Если Успех, то есть хотя бы одна строка в кадре данных.Если сбой, то фрейм данных пуст.