Проверьте это. вы можете сначала использовать regexp_extract
, чтобы получить последний di git, чтобы создать новый столбец, и используйте regexp_replace
, чтобы заменить последний di git пустой строкой ''.
from pyspark.sql import functions as F
df.show()
# +----+------+
# |name|number|
# +----+------+
# | bob| 34789|
# +----+------+
df.withColumn("number_1",F.regexp_replace(F.col('number'),r'(\d$)','')).withColumn("number_2", F.regexp_extract(F.col('number'), r'(\d$)',1)).withColumn("number_1", F.regexp_replace(F.col('number'), r'(\d$)', '')).drop(F.col('number')).show()
# +----+--------+--------+
# |name|number_1|number_2|
# +----+--------+--------+
# | bob| 3478| 9|
# +----+--------+--------+