Я хочу запустить значение индексов во фрейме данных с определенного значения вместо значения по умолчанию, равного нулю, если есть какой-либо параметр, который мы можем использовать для zipWithIndex () в pyspark.
следующее решение поможет запустить zipwithIndex со значением по умолчанию.
df = df_child.rdd.zipWithIndex().map(lambda x: (x[0], x[1] + index)).toDF()
где index - это номер по умолчанию, который вы хотите начать с zipWithIndex.