Я новичок в лазурных свечах / блоках данных и пытаюсь получить доступ к определенной строке, например, к 10-й строке в фрейме данных.
Это то, что я делал в блокноте до сих пор
1,Прочитать файл CSV в таблице
spark.read
.format("csv")
.option("header", "true")
.load("/mnt/training/enb/commonfiles/ramp.csv")
.write
.mode("overwrite")
.saveAsTable("ramp_csv")
2. Создайте DataFrame для «таблицы» ramp_csv
val rampDF = spark.read.table("ramp_csv")
3. Прочитайте конкретную строку
Я использую следующую логику в Scala
val myRow1st = rampDF.rdd.take(10).last
display(myRow1st)
, и она должна отображать 10-ю строку, но я получаю следующую ошибку
command-2264596624884586:9: error: overloaded method value display with alternatives:
[A](data: Seq[A])(implicit evidence$1: reflect.runtime.universe.TypeTag[A])Unit <and>
(dataset: org.apache.spark.sql.Dataset[_],streamName: String,trigger: org.apache.spark.sql.streaming.Trigger,checkpointLocation: String)Unit <and>
(model: org.apache.spark.ml.classification.DecisionTreeClassificationModel)Unit <and>
(model: org.apache.spark.ml.regression.DecisionTreeRegressionModel)Unit <and>
(model: org.apache.spark.ml.clustering.KMeansModel)Unit <and>
(model: org.apache.spark.mllib.clustering.KMeansModel)Unit <and>
(documentable: com.databricks.dbutils_v1.WithHelpMethods)Unit
cannot be applied to (org.apache.spark.sql.Row)
display(myRow1st)
^
Command took 0.12 seconds --
Не могли бы вы поделиться тем, что мне здесь не хватает? Я попробовал несколько других вещей, но это не сработало. Заранее спасибо за помощь!