Imputer(missing_values = "NaN", strategy = "mean", axis = 0)
Приведенная выше строка создает объект Imputer, который будет вменять / заменять отсутствующие значения, которые обозначены как NaN, средним значением значений.
impt = impt.fit(X[:,1:3])
Так что ему нужны некоторые данные, из которых он может рассчитать mean
, которые могут быть заменены отсутствующими значениями. Обычно это делается методом fit
, который вычисляет необходимые значения, средние в этом случае. fit
принимает некоторые данные для вычисления этих значений и обычно называется фазой training
.
impt.transform(X[:,1:3])
После того, как значения рассчитаны, они могут использоваться для новых данных, представленных ему. В этом случае он заменит отсутствующие данные рассчитанным (по методу fit
) средним значением. Это делается методом transform
.
Иногда может потребоваться запустить fit
и transform
из одних и тех же данных. В таких случаях вместо вызова fit с последующим преобразованием мы можем использовать метод fit_transform
.
X[:,1:3] = impt.fit_transform(X[:,1:3])