У меня есть spark dataframe
, который содержит 4 столбца:
(col_1, col_2, col_3, col_4) ==> (String, String, Int, Int)
В данных иногда col_3
пусто, например:
col_1|col_2|col_3|col_4
col_1|col_2||col_4
Я хочу вернуть новый dataframe
, содержащий всего 3 столбца, после тестирования столбцов 3 и 4:
если col_3
пусто, вернуть col_4
еще возврат col_3
Чтобы решить это, я сделал это:
>>>
>>> def calculcolumn(col_3, col_4):
... if (col_3 is None ):
... return col_4
... else:
... return col_3
...
>>>
>>> calculcolumn( ,12)
File "<stdin>", line 1
calculcolumn( ,12)
^
SyntaxError: invalid syntax
>>>
Но выдает SyntaxError
, как я могу решить это?