У меня есть столбец со значением * NZ, я хочу удалить *,
df.groupBy('State1').count().show()
(5) Spark Jobs
+-----------+-----+
| State1|count|
+-----------+-----+
| NT| 1423|
| ACT| 2868|
| SA|12242|
| TAS| 4603|
| WA|35848|
| *NZ| 806|
| QLD|44410|
| missing| 2612|
| VIC|40607|
| NSW|45195|
+-----------+-----+
Я пробовал эти два
df = df.select("State1", f.translate(f.col("State1"), "*", ""))
df = df.withColumn('State1', regexp_replace('State1', '*',''))
Первый код ничего не делает
Второй код работает, но когда я показываю ошибку броска
df.groupBy('State1').count().show()
Py4JJavaError Traceback (most recent call last)
org.apache.spark.SparkException: Job aborted due to stage failure: Task 1 in stage 725.0 failed 1 times, most recent failure: Lost task 1.0 in stage 725.0 (TID 13480, localhost, executor driver): java.util.regex.PatternSyntaxException: Dangling meta character '*' near index 0
Как заменить *