Pyspark: выбрать все столбцы, кроме определенных столбцов - PullRequest
0 голосов
/ 13 июня 2018

У меня есть большое количество столбцов в кадре данных PySpark, скажем, 200. Я хочу выбрать все столбцы, кроме, скажем, 3-4 столбцов.Как выбрать эти столбцы без необходимости вручную вводить имена всех столбцов, которые я хочу выбрать?

1 Ответ

0 голосов
/ 04 сентября 2018

В итоге я согласился на следующее:

  • Падение :

    df.drop('column_1', 'column_2', 'column_3')

  • Выбрать :

    df.select([c for c in df.columns if c not in {'column_1', 'column_2', 'column_3'}])

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...