Регулярное выражение в pyspark для проверки алфавитов и пробелов (также работа с уни-кодами) - PullRequest
1 голос
/ 03 марта 2020

Мне нужно регулярное выражение, которое проверяет приведенную ниже таблицу.

enter image description here

Оно должно возвращать действительное только в том случае, если в строке есть алфавиты или алфавиты с пробелом.

Я пробовал ниже коды, но это не позволяет пробел.

r = "\A\pL+\z"

Result_Name = Name_NotNull.withColumn("Name_Alphabets_Valid", when(col("first").rlike(r), lit("valid")).otherwise(lit("Invalid")))

1 Ответ

1 голос
/ 03 марта 2020

Попробуйте использовать класс символов, который допускает пробелы в дополнение к буквенным символам:

r = "\A[\pL\s]+\z"
...