Ваш вопрос немного неясен. Вы можете сделать что-то в этом вкусе. Сначала создайте свою метку времени, используя python
функциональные возможности:
import time
import datetime
timestamp = datetime.datetime.fromtimestamp(time.time()).strftime('%Y-%m-%d %H:%M:%S')
Затем, предполагая, что вы используете DataFrame API
, вставьте ее в свой столбец:
import pyspark.sql.functions as psf
df = (df
.withColumn('time',
psf.unix_timestamp(
psf.lit(timestamp),'yyyy-MM-dd HH:mm:ss'
).cast("timestamp")
)
.withColumn('batchid', psf.date_format('time', 'yyyyMMdd/yyy'))
.withColumn('delete', psf.lit(''))
Чтобы изменить порядок столбцов :
df = df.select(*["time","batchid","delete"] + [k for k in colnames if k not in ["time","batchid","delete"]])