Автоимпут Стохасти c Импутация ValuError - PullRequest
0 голосов
/ 20 января 2020

Я пытаюсь реализовать алгоритм импутации регрессии Stochasti c, используя autoimpute. Может кто-нибудь сказать мне , какой тип аргумента я должен отправить как y в fit_impute () .Do c здесь . Я хочу вменять все столбцы. Когда я пытаюсь отправить один столбец в качестве аргумента y, поскольку линейная регрессия является частью алгоритма, я получаю

ValueError: Найдено массив с 0 выборками (формами = (0, 8)) хотя требуется минимум 1.

Вот информация об используемом наборе данных

class <'pandas .core.frame.DataFrame'>

RangeIndex: 768 записей, от 0 до 767

Столбцы данных (всего 9 столбцов):

Беременность 768, не ноль, int64

Глюкоза, 768, не- null int64

BloodPressure 768, не нулевой int64

SkinThickness 768, не нулевой int64

Insulin 768, не нулевой int64

BMI 768, не нулевой float64

DiabetesPedigreeFunction 768, ненулевое значение float64

Возраст 768, ненулевое значение int64

Результат 768, ненулевое значение int64

dtypes: float64 (2), int64 (7) использование памяти: 54,1 КБ Нет

import numpy as np
import pandas as pd
from autoimpute.imputations.series import StochasticImputer
dataset = pd.read_csv("diabetes.csv")
dataset=dataset.replace("?",np.nan)
imp=StochasticImputer()
df_filled = imp.fit_impute(dataset[['Pregnancies','Glucose','BloodPressure','SkinThickness','Insulin','BMI','DiabetesPedigreeFunction','Age']],pd.Series(dataset['Outcome']))
print(df_filled)
...