Если вы используете take
на rdd
в качестве
rdd.take(10)
, он вернет вам Array
вместо rdd
и saveAsTextFile
не будет работать с массивом.
Что вы можете сделать, это использовать zipWithIndex
для фильтрации и сохранить отфильтрованное как
rdd.zipWithIndex().filter(_._2 < 100).map(_._1).saveAsTextFile("path to the output file")
Здесь _._2 < 100
используется, как вы сказали, что хотите сохранить первые 100 данных