У меня есть кадр данных, который выглядит следующим образом:
+--------------------+-----------------+
| recommendations|relevant_products|
+--------------------+-----------------+
|[12949, 12949, 71...| [4343]|
|[12949, 12949, 71...| [1589]|
|[12949, 12949, 71...| [11497]|
evaluation_ds:org.apache.spark.sql.Dataset[docCompare] = [recommendations: array, relevant_products: array]
Это класс, используемый в наборе данных: case class docCompare (recommendations: Array[Int], relevant_products: Array[Int])
Как можноЯ конвертирую его в JavaRDD в следующем формате:
org.apache.spark.rdd.RDD[(Array[?], Array[?])]