col(*)
выбирает все столбцы
В вашем примере это получение всех столбцов и создание нового с именем new_gender со значениями Male, Female или Unknow, зависящими от гендерного столбца
ВХОД
df.show
+------+---+----------+
|gender|age|birthplace|
+------+---+----------+
| M| 34| USA|
| F| 14| UK|
| M| 12| Spain|
+------+---+----------+
ВЫХОД
+------+---+----------+----------+
|gender|age|birthplace|new_gender|
+------+---+----------+----------+
| M| 34| USA| Male|
| F| 14| UK| Female|
| M| 12| Spain| Male|
+------+---+----------+----------+