Я пытаюсь убедиться, что определенный столбец в кадре данных не содержит недопустимых значений (нечисловые данные). Для этого я пытаюсь использовать сопоставление регулярных выражений, используя rlike
для сбора недопустимых значений в данных:
Мне нужно собрать значения со строковыми символами или пробелами или запятыми или любыми другими символами, которые не похожи на числа. Я пытался:
spark.sql("select * from tabl where UPC not rlike '[0-9]*'").show()
, но это не работает. выдает 0 строк.
Любая помощь приветствуется. Спасибо.