Я использую последнюю версию Spark (2.4.4), и она показывает предупреждение об устаревании explode
. Пожалуйста, предложите эффективную замену для следующего простого варианта использования:
scala> val myDF = Seq((1.2, "a b c d"), (2.1, "b g cc"), (4.4, "a b g cc")).toDF("time", "sentence")
myDF: org.apache.spark.sql.DataFrame = [time: double, sentence: string]
scala> val wordsDF = myDF.explode("sentence","word")((line: String) => line.split(" ")).groupBy("word").count().filter($"count" > 1).show
<console>:25: warning: method explode in class Dataset is deprecated: use flatMap() or select() with functions.explode() instead
val wordsDF = myDF.explode("sentence","word")((line: String) => line.split(" ")).groupBy("word").count().filter($"count" > 1).show
^
+----+-----+
|word|count|
+----+-----+
| cc| 2|
| g| 2|
| b| 3|
| a| 2|
+----+-----+
wordsDF: Unit = ()
scala>
Заранее спасибо.