Pyspark Rename column в зависимости от положения столбца - PullRequest
0 голосов
/ 28 мая 2020

Как мне переименовать 3-й столбец фрейма данных в PySpark. Я хочу назвать индекс столбца, а не его фактическое имя.

Вот моя попытка:

df
Col1    Col2    jfdklajfklfj
   A       B               2

df.withColumnRenamed([3], 'Row_Count')

1 Ответ

3 голосов
/ 28 мая 2020

Поскольку python индексирование начинается с 0, вы можете проиндексировать df.columns список, вычитая 1:

index_of_col = 3
df.withColumnRenamed(df.columns[index_of_col-1],'Row_Count').show()

+----+----+---------+
|Col1|Col2|Row_Count|
+----+----+---------+
|   A|   B|        2|
+----+----+---------+
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...