Spark 1.6 с scala
я пытаюсь выполнить регулярное выражение в spark sql.
В Spark Dataframe один из столбцов содержит значение типа
COLA
A0001
B5678
""
NULL
0012A6
B12345678
Я пытаюсьОтфильтруйте все записи, в которых значения colA не начинаются с буквы, за которой следует 4-значное число.
Вывод будет выглядеть как
""
NULL
0012A6
B12345678
Поскольку это недопустимое число.
iпопробовал это в mssql как
[a-zA-Z]{2}\d{4}
Как мы можем реализовать в Spark sql. Пожалуйста, поделитесь своим предложением.
Спасибо