Выберите столбцы Dataframe на основе количества нулей в каждом - PullRequest
0 голосов
/ 04 июня 2018

Я видел похожие вопросы, но то, с чем я сталкиваюсь, немного отличается.Я пытаюсь выбрать подмножество столбцов в моем фрейме данных, основываясь на том, имеют ли столбцы менее 300 нулей.

df[df.columns[df.isnull().any()]].isnull().sum()<300

Мне удалось создать этот логический массив, но как мне передать эту информациювернуться, чтобы выбрать только столбцы df, где это правда?

Ответы [ 2 ]

0 голосов
/ 04 июня 2018

Давайте используем thresh из документа Требуем, чтобы было много не-NA значений.

df.dropna(axis = 1,thresh = len(df)-300)
0 голосов
/ 04 июня 2018

any является избыточным, вы можете сделать это с помощью isnull / isna и sum:

v = df.isna().sum().lt(300)
df[v.index[v]]

или

df.loc[:, df.isna().sum().lt(300)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...