У меня есть датафрейм, как показано ниже.
+------+----+----+
| col1 |col2|col3|
+------+----+----+
|abc | c |h |
|abc | c |h |
|abc | c |h |
+------+----+----+
для col2 У меня есть значение c, как показано на рисунке выше.
Теперь для всех значений c следует заменить на cat, а h, то есть значение col3, заменить на hat.
Я могу легко добиться этого с помощью следующего утверждения
dataframe.withColumn("col2", when(col("col2").equalTo("c"), "cat").otherwise(col("col2") )
но я хочу также иметь исходные значения. Как, скажем, мой окончательный кадр данных должен выглядеть так, как показано ниже
+------+----+----+-----+----+
| col1 |col2|col3| col4|col5|
+------+----+----+-----+----+
|abc | c |cat | h|hat |
|abc | c |cat | h|hat |
|abc | c |cat | h|hat |
+------+----+----+----+-----+
Как мне этого добиться ???
Любая помощь ....:)