max_value и min_value для каждого столбца в scikit IterativeImputer - PullRequest
1 голос
/ 14 февраля 2020

У меня есть этот набор данных с 78 столбцами и 5707 строками. Почти в каждом столбце есть пропущенные значения, и я хотел бы вложить их в IterativeImputer. Если я правильно понял, это сделает «более умное» вменение для каждого столбца на основе информации из других столбцов.

Однако при вменении я не хочу, чтобы вмененные значения были меньше наблюдаемого минимума или больше наблюдаемого максимума. Я понимаю, что есть параметры max_value и min_value, но я не хочу навязывать «глобальный» предел для импутаций, вместо этого я хочу, чтобы каждый столбец имел свои собственные max_value и min_value (что является уже соблюдаются максимальные и минимальные значения). В противном случае значения в столбцах не имеют смысла (отрицательные значения для численности персонала, отрицательные значения для ставок и т. Д. c.)

Есть ли способ реализовать это?

1 Ответ

0 голосов
/ 14 февраля 2020

Так что, если вы хотите установить максимальные и минимальные значения для каждого столбца, вы можете go в al oop и в каждой итерации выбрать столбец, используя sklearn.compose.make_column_selector или sklearn.compose.make_column_transformer, а затем применить итерационный вывод для этого столбца. давая максимум и минимум этого столбца в качестве параметра.

...