Работает, используя RandomRDD из пакета mllib
import org.apache.spark.mllib.random.RandomRDDs._
val rdd = normalRDD(sc, 1000000L, 10).map(m => Row(schema.map(_ => Array.fill(1000)(m).mkString).toList: _*))
val schema = StructType((0 to 2000).map(n => StructField(s"column_$n", IntegerType)))
spark.sqlContext.createDataFrame(rows, schema)