Как применить регулярное выражение на искре для извлечения только числа на искре - PullRequest
0 голосов
/ 01 февраля 2019

Я пытаюсь сделать регулярное выражение для моего набора данных.моя проблема в том, что я хочу заменить алфавиты пустыми.

я пробовал следующий код

   val test_reg = xmlData.withColumn("volume",regexp_replace($"trans_volume", "[^0-9]", ""))

, но если мой ввод содержит что-то отличное от алфавитов, это также заменяет пустым

  lets say my input contains 34m89 it replaces as 3489 which is perfectly fine.
  but if my input contains 34.78 that is getting replaced as 3478 which actually should not happen. 

Может ли кто-нибудь помочь мне решить мою проблему?

1 Ответ

0 голосов
/ 01 февраля 2019
val test_reg = xmlData.withColumn("volume",regexp_replace($"trans_volume", "[^0-9].", ""))

вероятно, вам следует добавить . к вашему регулярному выражению "[^ 0-9]."

...