Вменение пропущенного значения с использованием пакета fancyimpute KNN в python - PullRequest
0 голосов
/ 29 сентября 2018

Я пытаюсь использовать пакет KNN для вменения пропущенных значений, которые есть в моем фрейме данных.Мои столбцы данных имеют разные диапазоны, т.е. некоторые из них имеют гораздо большую ценность, чем другие.

Насколько я понимаю, алгоритм KNN использует евклидово расстояние для определения ближайших соседей.Я сомневаюсь, что мне следует нормализовать данные перед подачей их в алгоритм или по умолчанию?

1 Ответ

0 голосов
/ 29 сентября 2018

Здесь вы можете увидеть в классе fancyimpute.knn.KNN в коде, что он принимает атрибут normalizer, который можно установить для любого объекта с помощью методов fit() и transform().

По умолчанию оно установлено на None, поэтому вам придется явно создать нормализатор и передать его объекту класса KNN.

...