Запустить индекс с определенным значением zipWithIndex в pyspark - PullRequest
0 голосов
/ 08 февраля 2020

Я хочу запустить значение индексов во фрейме данных с определенного значения вместо значения по умолчанию, равного нулю, если есть какой-либо параметр, который мы можем использовать для zipWithIndex () в pyspark.

1 Ответ

0 голосов
/ 10 февраля 2020

следующее решение поможет запустить zipwithIndex со значением по умолчанию.

df = df_child.rdd.zipWithIndex().map(lambda x: (x[0], x[1] + index)).toDF()

где index - это номер по умолчанию, который вы хотите начать с zipWithIndex.

...