Я хочу преобразовать Dataframe, который содержит значения Double, в List, чтобы я мог использовать его для расчетов.Каково ваше предложение, чтобы я мог взять правильный тип List (т.е. Double)?
Мой подход такой:
var newList = myDataFrame.collect().toList
, но он возвращает тип Список [org.apache.spark.sql.Row] , который я не знаю, чтоэто точно!
Можно ли забыть этот шаг и просто передать мой Dataframe внутри функции и сделать из него вычисления?( Например, я хочу сравнить третий элемент его второго столбца с определенным двойным. Возможно ли это сделать прямо из моего Dataframe? )
Любой ценой, которую я должен понятькак каждый раз создавать правильный тип списка!
РЕДАКТИРОВАТЬ:
Входной кадр данных:
+---+---+
|_c1|_c2|
+---+---+
|0 |0 |
|8 |2 |
|9 |1 |
|2 |9 |
|2 |4 |
|4 |6 |
|3 |5 |
|5 |3 |
|5 |9 |
|0 |1 |
|8 |9 |
|1 |0 |
|3 |4 |
|8 |7 |
|4 |9 |
|2 |5 |
|1 |9 |
|3 |6 |
+---+---+
Результат после преобразования:
List((0,0), (8,2), (9,1), (2,9), (2,4), (4,6), (3,5), (5,3), (5,9), (0,1), (8,9), (1,0), (3,4), (8,7), (4,9), (2,5), (1,9), (3,6))
Но каждый элемент списка должен иметь тип Double.