Для этого можно использовать метод replace
:
>>> df.replace("HIGH", "1")
Имейте в виду, что вам необходимо заменить подобные типы данных, поэтому попытка заменить "HIGH"
на 1
приведет к исключению.
Изменить: Вы также можете использовать regexp_replace
для решения обеих частей вашего вопроса, но вам нужно применить его ко всем столбцам:
>>> df = df.withColumn("col1", regexp_replace("col1", "^(?!HIGH).*$", "0"))
>>> df = df.withColumn("col1", regexp_replace("col1", "^HIGH$", "1"))