ошибка регрессора дерева решений-ValueError: входные данные содержат NaN, бесконечность или значение, слишком большое для dtype ('float32') - PullRequest
1 голос
/ 07 мая 2020

При применении этого алгоритма дерева решений к данным я сталкиваюсь с указанной ниже ошибкой. Может ли кто-нибудь помочь решить эту проблему?

from sklearn.tree import DecisionTreeRegressor regressor = DecisionTreeRegressor() regressor.fit(X_train, y_train)

Ошибка: ValueError: Input contains NaN, бесконечность или слишком большое значение для dtype ('float32').

1 Ответ

0 голосов
/ 07 мая 2020

sklearn сообщает вам, что в вашем X_train или y_train отсутствуют значения. Это очень часто встречается в наборах данных реального мира. Поскольку алгоритмы машинного обучения обычно требуют числовых значений c для работы математики, вам нужно как-то заполнить отсутствующие значения. Общие методы включают замену их средним, медианой или модой столбца.

Вот подробное руководство по подстановке пропущенных значений в sklearn: https://scikit-learn.org/stable/modules/impute.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...