У меня есть Spark Dataframe, как показано ниже:
+---------+
|col_str_1|
+---------+
| 1|
| 2|
| 3|
| 4|
| 5|
| 6|
| 7|
| 8|
| 9|
| a|
| b|
| c|
| d|
| e|
| f|
| g|
| h|
| 1|
| 2|
| 3.0|
+---------+
Я хочу отделить значения строки / int / float на основе запроса
Например: Req для STRING, вернуть DFдолжно быть как показано ниже
+---------+
|col_str_1|
+---------+
| a|
| b|
| c|
| d|
| e|
| f|
| g|
| h|
+---------+
Req для целых чисел, обратный DF должен быть как ниже
+---------+
|col_str_1|
+---------+
| 1|
| 2|
| 3|
| 4|
| 5|
| 6|
| 7|
| 8|
| 9|
| 1|
| 2|
+---------+
Попробовал следующие шаги:
>> df = sqlContext.sql('select * from --db--.vt_prof_test')
>> columns = df.columns[0]
>> df.select(columns).????
как продолжить, либо используйте фильтр или карту, кто-нибудь может мне помочь ??