как заполнить пропущенные значения средним значением каждого столбца - PullRequest
0 голосов
/ 29 августа 2018

my table

   y12N=y12N.fillna(y12N.mean())

Я пробовал это среди прочего, это не заполняет данные в мои столбцы, так как таблица остается такой, как есть. Значения NaN являются значениями np.NaN.

Ответы [ 3 ]

0 голосов
/ 29 августа 2018
# To read data from csv file
Dataset = pd.read_csv('Data.csv')

# To get values in variable 'X'
X = Dataset.iloc[:, :].values

# To calculate mean use imputer class

from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values='NaN', strategy='mean', axis=0)


 imputer = imputer.fit(X[:, :])
 X[:, :] = imputer.transform(X[:, :])
0 голосов
/ 29 августа 2018

Вы можете использовать это для заполнения NaN соответствующими столбцами mean():

y12N = y12N.apply(lambda x: x.fillna(x.mean()))
0 голосов
/ 29 августа 2018

Обычно я делаю это так:

columnsWithNa = ['column1', 'column2']
for column in columnsWithNa :
    df[column].fillna(df[column].mean()[0], inplace = True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...