У меня есть большое количество столбцов в кадре данных PySpark, скажем, 200. Я хочу выбрать все столбцы, кроме, скажем, 3-4 столбцов.Как выбрать эти столбцы без необходимости вручную вводить имена всех столбцов, которые я хочу выбрать?
В итоге я согласился на следующее:
Падение :
df.drop('column_1', 'column_2', 'column_3')
Выбрать :
df.select([c for c in df.columns if c not in {'column_1', 'column_2', 'column_3'}])