Я работаю над набором данных с несколькими пропущенными значениями в его атрибутах.
Сделав типичную процедуру предварительной обработки данных, мой следующий шаг - попытаться приспособить регрессионную модель к вменению пропущенных значений.Тем не менее, когда я пытаюсь использовать IterativeImputer
из fancyimpute
.Я сталкиваюсь с этой ошибкой:
C:\Users\User.DC241-12\Anaconda3\lib\site-packages\sklearn\linear_model\ridge.py:942: RuntimeWarning: overflow encountered in square
v = s ** 2
****hierarchy of filenames in which error is happening****
Input contains NaN, infinity or a value too large for dtype('float64')
Я понимаю, что пропущенные значения, введенные в IterativeImputer
, должны быть представлены как NaN
s, поэтому я предполагаю, что здесь нет причины.Должен ли я масштабировать свои данные до того, как перейти к процессу вменения.Но разве это не повлияет на процесс вменения?
Спасибо!