Для l oop отбрасывать столбцы на основе нулевых значений - PullRequest
0 голосов
/ 19 февраля 2020

Здравствуйте, у меня есть фрейм данных с именем l c. И в форме фрейма данных (235607,146) я смог написать код, который показывает мне процент нулевых значений в каждом столбце (np.sum(lc.isnull())/lc.shape[0]*100). И теперь мне нужна помощь в написании для l oop, который отбрасывает все столбцы с нулевыми значениями, превышающими 70 процентов

1 Ответ

1 голос
/ 19 февраля 2020

Вы можете использовать boolean индексирование. Снимите mean, чтобы проверить процент пустых значений в каждом столбце. Так как false будет возвращено в случае столбцов, которые не соответствуют критериям, они не будут помещены в дробные списки.

import numpy as np
df.loc[:,df.isin([0,' ',np.nan,None]).mean()<0.7]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...