У меня есть таблица
DEST_COUNTRY_NAME ORIGIN_COUNTRY_NAME count
United States Romania 15
United States Croatia 1
United States Ireland 344
Я преобразовал вышеупомянутое в DataFrame
val flightData2015 = spark
.read
.option("inferSchema", "true")//infers the input schema automatically from data
.option("header", "true")//uses the first line as names of columns.
.csv("/data/flight-data/csv/2015-summary.csv");
Я могу получить только один столбец из DataFrame
, используя col
function
scala> data.col("count");
res70: org.apache.spark.sql.Column = count
Но я замечаю, что никаких действий для столбца не указано.Могу ли я выполнить какие-либо действия с Column
, например max
, show
и т. Д.
Я пытался запустить функцию max
в столбце count
, но все еще не вижулюбой результат.
scala> max(dataDS.col("count"));
res78: org.apache.spark.sql.Column = max(count)
Как выполнить действие на Column
?