вычисление пропущенных значений в кадре данных искры - PullRequest
0 голосов
/ 25 февраля 2020

У меня есть фрейм данных, и мне нужно рассчитать количество пропущенных значений и его%. У меня есть код, написанный на Python; он не работает с кодом cdsw

, как показано ниже:

def missing_values_table(dataset):
        mis_val = df.isnull().sum()
        mis_val_percent = 100 * df.isnull().sum() / len(df)
        mis_val_table = pd.concat([mis_val, mis_val_percent], axis=1)
        mis_val_table_ren_columns = mis_val_table.rename(
        columns = {0 : 'Missing Values', 1 : '% of Total Values'})
        mis_val_table_ren_columns = mis_val_table_ren_columns[
            mis_val_table_ren_columns.iloc[:,1] != 0].sort_values(
        '% of Total Values', ascending=False).round(1)
        print ("Your selected dataframe has " + str(df.shape[1]) + " columns.\n"      
            "There are " + str(mis_val_table_ren_columns.shape[0]) +
              " columns that have missing values.")
        return mis_val_table_ren_columns

missing_values_table(dataset)

Также; Я искал, и он говорит, что мы не можем вычислить пропущенные значения для строковых столбцов. Это действительно так? Можете ли вы изменить код выше

...