Как разбить 6-значное число на один столбец с 4 цифрами и один столбец с 2 цифрами (например: 201452 в 2014 и 52) - PullRequest
0 голосов
/ 15 мая 2019

Как разделить 6-значное число на один столбец с 4 цифрами и один столбец с 2 цифрами (например, с 201452 по 2014 и 52) в PySpark.Он должен систематически разбивать 6-значные числа после четвертой.

Я уже пробовал метод pyspark.split(...), но там я не могу разбить 6-значные числа на основе позиции.Как я могу указать эту позицию?

split_col=py.sql.functions.split(lambda x: df_datetime["WEEKNR"], '4')
df_datetime=df_datetime.withColumn('Name 1', split_col.getItem(0)).show()

1 Ответ

0 голосов
/ 15 мая 2019

Вы просто ищете функцию substring

from pyspark.sql import functions as F

df.withColumn(
    "four_let",
    F.substring(F.col("WEEKNR"), 1, 4)
)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...