Я новичок / все еще учусь Apache Spark / Scala. Я пытаюсь проанализировать набор данных и загрузил набор данных в Scala. Однако, когда я пытаюсь выполнить базовый c анализ, такой как макс, мин или среднее, я получаю ошибку -
error: value select is not a member of org.apache.spark.rdd.RDD[Array[String]]
Может кто-нибудь, пожалуйста, пролить свет на это, пожалуйста? Я использую Spark на облачном хранилище организации.
Код:
// Reading in the csv file
val df = sc.textFile("/user/Spark/PortbankRTD.csv").map(x => x.split(","))
// Select Max of Age
df.select(max($"age")).show()
Ошибка:
<console>:40: error: value select is not a member of org.apache.spark.rdd.RDD[Array[String]]
df.select(max($"age")).show()
Пожалуйста, дайте мне знать, если вам нужна дополнительная информация. Спасибо