Подмножество данных через список - PullRequest
0 голосов
/ 01 июля 2019

Я dummified один столбец в моем фрейме данных, используя get_dummies, но это привело к дополнительным 400 столбцам.Проблема заключается в том, что я хотел бы поместить под фрейм данных, который теперь содержит более 700 столбцов, для выполнения ниже операции

replace([np.inf, -np.inf], np.nan).dropna()

Я попытался изолировать новые столбцы, созданные get_dummies, сохранив их в списке, который я инициализировал какcol1.Когда я попытался установить df с помощью

df = df[['var1','var2','var3',[col1] ]]

, я получил сообщение об ошибке «ValueError: установка элемента массива с последовательностью»

Есть ли способ выполнить поднаборновые макеты без необходимости набирать их все во время поднабора?

1 Ответ

0 голосов
/ 01 июля 2019

Вы можете использовать звездочку, чтобы распаковать свой список в столбце выбора

В противном случае вы передаете свой список как подсписок в список столбцов. Ваш текущий метод становится:

df[['var1','var2','var3',['sub1','sub2','sub3']]]

Но:

df = df[['var1','var2','var3',*col1]]

распаковано в

df[['var1','var2','var3','sub1','sub2','sub3']]
...