как извлечь формат числа из строки, используя pyspark - PullRequest
0 голосов
/ 26 ноября 2018

В моей таблице есть столбец с таким значением:

  |col_A|
  -------
  |00140|
  -------
  |00120|
  -------
  |00058|
  -------
  |00009|
  -------
  |00052|

Я хочу удалить все 0 слева.Я использую pyspark для построения dataframe.Ниже приведен пример:

while tab.col_A.like('0%'):
        tab = tab.withColumn('tab_B', tab['col_A'][2:5])

Когда я пытаюсь выполнить этот код, у меня появляется эта ошибка:

Невозможно преобразовать столбец в bool

Пожалуйста, помогите.

1 Ответ

0 голосов
/ 26 ноября 2018

Я попробовал этот код:

tab = tab.withColumn("col_B", F.regexp_extract(tab['col_A'], '[1-9][0-9]*',0))

Проблема решена.

Спасибо,

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...