Я хотел бы создать модель линейной регрессии, которая бы показала положительную корреляцию между ИМТ и риском заболевания (количественный показатель заболеваемости через год после базовой линии).
Набор данных тот же, что и у склеарна набор данных-- import sklearn.datasets.load_diabetes
И это URL (https://www4.stat.ncsu.edu/~boos/var.select/diabetes.tab.txt)
Я импортировал всю таблицу с использованием read_csv (args) и назвал ее ' data '
df = DataFrame({'BMI': data['BMI'], 'Target': data['Y']}).sort_values('BMI')
df.plot.scatter('BMI', 'Target')
model = LinearRegression(fit_intercept=True)
model.fit(data[['BMI']], data['Y'])
x_test = np.linspace(data['BMI'].min(), data['BMI'].max())
y_pred = model.predict(x_test[:, np.newaxis])
df.plot(x_test, y_pred, linestyle=":", color="red")
Когда я пытаюсь это сделать, выдается большое сообщение об ошибке, я не понимаю, почему это происходит?