Pyspark с использованием lpad не принимает функцию длины - PullRequest
0 голосов
/ 22 апреля 2020

Я пытаюсь добавить префикс к значению строки данных столбца с помощью:

`df.select('data_id',lpad(df['data'],length(df.data) +3 ,'p1/'))`

Но я получил эту ошибку:

TypeError: объект 'Column' не вызывается

Я пытался привести с int(length(df.data)), но сообщение было

TypeError: аргумент int () должен быть строкой или числом, а не 'столбцом '

Я также пытался .cast("integer"), и я получил аналогичную ошибку.

Кроме того, мне нужно добавить префикс только при условии, что data_id находится под интервалом, как [1 .. 100]. Вы можете мне помочь?

...