Я пытаюсь удалить первые два символа в столбце для каждой строки в моем фрейме данных Pyspark.Длина следующих символов отличается, поэтому я не могу использовать решение с substring .
пример фрейма данных:
columns = ['text']
vals = [(h0123),(b012345), (xx567)]
РЕДАКТИРОВАТЬ на самом деле проблема усложняется, так как иногда у меня есть буква и два нуля в качестве первых символов, а затем необходимо удалить оба0.
Пример:
columns = ['text']
vals = [(h0123),(b012345), (x00567), (L0034)]
Ожидаемый результат:
(123),(12345), (567), (34)