Я использую следующий код для печати счетчика пропущенных значений и имен столбцов.
#Looking for missing data and then handling it accordingly
def find_missing(data):
# number of missing values
count_missing = data_final.isnull().sum().values
# total records
total = data_final.shape[0]
# percentage of missing
ratio_missing = count_missing/total
# return a dataframe to show: feature name, # of missing and % of missing
return pd.DataFrame(data={'missing_count':count_missing, 'missing_ratio':ratio_missing},
index=data.columns.values)
find_missing(data_final).head(5)
Я хочу печатать только те столбцы, в которых пропущено значение, поскольку у меня огромный набор данных, содержащий около 150 столбцов.
Набор данных выглядит следующим образом
A B C D
123 ABC X Y
123 ABC X Y
NaN ABC NaN NaN
123 ABC NaN NaN
245 ABC NaN NaN
345 ABC NaN NaN
В выводе я просто хотел бы увидеть:
missing_count missing_ratio
C 4 0.66
D 4 0.66
, а не столбцы A и B, поскольку там нет пропущенных значений