У меня есть фрейм данных, в котором мне нужно рассчитать значение, основанное на других примерах. Столбец числовой и подразумевает отраслевые цифры, fx (1111 - IT, 1234 - финансы и т. Д.). Я попытался применить KNNImputer, и он выдает число, но, насколько я понял, он усредняет выходные данные своих соседей, таким образом генерируя число, которого нет в столбце.
следующий код импутера :
X = df.copy()
imputer = KNNImputer(n_neighbors=5)
filled = imputer.fit_transform(X)
cols = X.columns
df_imputed = pd.DataFrame(data=filled, columns = cols)
Вывод, который он выдает: 6405.2 Тем не менее, ближайшими отраслевыми кодами являются 6399 или 6411
. Как сделать вменение для числового столбца, учитывая только существующие значения?