sklearn.impute.MissingIndicator ValueError: Вход содержит NaN, бесконечность или значение, слишком большое для dtype ('float64') .: - PullRequest
0 голосов
/ 26 октября 2018

При создании и тестировании некоторых примеров с библиотекой вменения sklearn (v0.0.20) я столкнулся с вышеуказанной ошибкой. Я настроил следующий простой пример и хочу создать функцию MissingIndicator для NaN и 999.

Все отлично работает для NaN, но если я пытаюсь заменить параметр отсутствующих значений на 999, я получаю эту ошибку. Согласно документации номера должны быть в порядке.

enter image description here

Вот код и ошибка:

X = pd.DataFrame(
    np.array([5,7,8,-5,0,25,999,
              1,-1, np.NaN, 0, np.NaN])\
              .reshape((4,3)))

from sklearn.impute import MissingIndicator
indicator_1 = MissingIndicator(missing_values=np.NaN)
indicator_1.fit_transform(X)
indicator_2 = MissingIndicator(missing_values=999)
indicator_2.fit_transform(X)

enter image description here

Я знаю, что действительно легко создать рабочий отсутствующий индикатор самостоятельно. Но мне было интересно, правильно ли я использую библиотеку или это какая-то внутренняя проблема?

Спасибо!

...