Для простоты и в псевдокоде, если я делаю myDF = spark.read.option('inferSchema', True).json(someFiles), а затем делаю myDF.count(), читает ли спарк данные с диска дважды?
myDF = spark.read.option('inferSchema', True).json(someFiles)
myDF.count()