SelectKBest ValueError после лог-преобразования целевой переменной - PullRequest
0 голосов
/ 05 сентября 2018

В настоящее время я делаю некоторый анализ цен на жилье в наборе данных Ames Iowa. Я успешно обработал данные и удалил все пропущенные значения и т. Д., И я собираюсь сделать некоторый регрессионный анализ. Я хочу построить три регрессионных модели: первая с двумя лучшими характеристиками, вторая с 15 функциями и третья со всеми доступными переменными. Я использую SelectKBest, чтобы сделать выбор функции. Моя целевая переменная - это SalePrice, который я преобразовал в лог. Я всегда получаю ошибку значения от SelectKBest по некоторым причинам. Интересно, что если я не преобразую лог-преобразование «SalePrice», все работает нормально. Я проверил d-тип моей целевой переменной и, как и ожидалось, является плавающей точкой.
Кто-нибудь может мне помочь?
Я был бы очень признателен! enter image description here

1 Ответ

0 голосов
/ 06 сентября 2018

Вы используете

SelectKBest(chi2)

Согласно документации chi2:

Параметры:

X : {array-like, sparse matrix}, shape = (n_samples, n_features_in)
    Sample vectors.

y : array-like, shape = (n_samples,)
    Target vector (class labels).

chi2 работает только с задачами классификации, но не с регрессией. Ваша текущая проблема прогнозирования продажной цены является задачей регрессии и, следовательно, ошибкой.

Возможно, попробуйте f_regression вместо chi2

...