Как найти% пропущенных значений, которые больше 1 или 0 в python - PullRequest
0 голосов
/ 23 апреля 2020

Я нахожу процент пропущенных значений в моем наборе данных с более чем 0 или 1, поскольку я хочу вменять его позже.

Я использую этот код df, в котором есть данные

df.isnull().mean()*100

вывода вышеуказанного кода

loan_amount         0.000000
funded_amount       0.000000
investor_funds      0.000000
term                0.000000
interest_rate       0.000000
                    ...    
settlement_term    98.534284
year                0.000000
loan_condition      0.000000
region              0.000000
emp_length_int      6.438357

этот код дает мне процент. Теперь, когда мой набор данных содержит более 200 столбцов, мне трудно попасть на мою страницу, поэтому я также не могу увидеть весь результат.

если я делаю это

df.isnull().mean()*100>0

, то это дает мне логическое значение (правда, ложь), которое полностью имеет для меня смысл. Но здесь мне нужны цифры, а не логические.

Цель вывода в том, что я не хочу строки, в которых написано 0. Но нужны все строки с числом больше 0

Ответы [ 2 ]

0 голосов
/ 23 апреля 2020

Я получил ответ. Отправка сообщений для получения помощи от других.

Нам нужно преобразовать ее в кадры данных и сначала создать столбец, а затем использовать оператор сравнения>. Пример-

df_1= pd.DataFrame(df_com.isnull().mean()*100,columns=['Percentage'])
df_1[df_1['Percentage']>0]

Это даст вам желаемый вывод пропущенных% значений с большим, чем 0.

0 голосов
/ 23 апреля 2020

Я лично не использую кадры данных, но кажется, что делает то, что вы хотите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...