У меня есть датафрейм из 10 столбцов, и я хочу сделать функцию - конкатенация на основе массива столбцов, которые поступают в качестве входных данных:
arr = ["col1", "col2", "col3"]
Пока это актуально:
newDF = rawDF.select(concat(col("col1"), col("col2"), col("col3") )).exceptAll(updateDF.select( concat(col("col1"), col("col2"), col("col3") ) ) )
Также:
df3 = df2.join(df1, concat( df2.col1, df2.col2, df2.col3, df2.col3 ) == df1.col5 )
Но я хочу сделать al oop или функцию для этого на основе входного массива (не так жестко, как сейчас).
Что лучше способ