У меня есть фрейм данных pyspark со столбцом, из которого я пытаюсь извлечь информацию. Например, столбец представляет собой комбинацию из 4 внешних ключей, которая может выглядеть следующим образом:
Пример 1: 12345-123-12345-4
Пример 2: 5678-4321- 123-12
Я пытаюсь извлечь последний фрагмент строки, в данном случае это 4 и 12. Есть идеи, как мне это сделать?
Я пробовал следующее :
df.withColumn("result", sf.split(sf.col("column_to_split"), '\_')[1])\
.withColumn("result", sf.col("result").cast('integer'))
Однако результат для двойных значений di git равен нулю, и он возвращает только целое число для однозначных цифр (0-9)
Спасибо!