У меня есть фрейм данных pyspark, содержащий один столбец строки.
Пример df:
number | id
---------------
12 | [12, .AZ, .UI]
------------------------
14 | [CL, .RT, OP.]
Я хочу удалить символ '.'
I попытался использовать regexp_replace
:
df = df.select("id", F.regexp_replace(F.col("id"), ".").alias("id"))
Но я думаю, что regexp_replace - хорошее решение для строки, а не массива.
Как удалить этот символ из массива? Спасибо