Question

Мне нужен доверительный интервал результата линейной регрессии. Я работаю с набором данных о ценах на жилье в Бостоне.

Я нашел этот вопрос: Как рассчитать доверительный интервал 99% для наклона в модели линейной регрессии в python? Однако это не совсем отвечает на мой вопрос.

Вот мой код:

import numpy as np
import matplotlib.pyplot as plt
from math import pi

import pandas as pd
import seaborn as sns

# import the data
from sklearn.datasets import load_boston
boston_dataset = load_boston()

boston = pd.DataFrame(boston_dataset.data, columns=boston_dataset.feature_names)
boston['MEDV'] = boston_dataset.target

X = pd.DataFrame(np.c_[boston['LSTAT'], boston['RM']], columns=['LSTAT', 'RM'])
Y = boston['MEDV']

from sklearn.model_selection import train_test_split

# splits the training and test data set in 80% : 20%
# assign random_state to any value.This ensures consistency.
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=5)

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

lin_model = LinearRegression()
lin_model.fit(X_train, Y_train)

# model evaluation for training set

y_train_predict = lin_model.predict(X_train)
rmse = (np.sqrt(mean_squared_error(Y_train, y_train_predict)))
r2 = r2_score(Y_train, y_train_predict)

# model evaluation for testing set

y_test_predict = lin_model.predict(X_test)
# root mean square error of the model
rmse = (np.sqrt(mean_squared_error(Y_test, y_test_predict)))

# r-squared score of the model
r2 = r2_score(Y_test, y_test_predict)

plt.scatter(Y_test, y_test_predict)
plt.show()

Как я могу получить, например, 95% или 99% доверительный интервал из этого? Есть ли какая-то встроенная функция или фрагмент кода?

AerysS · Answer 1 · 18 апреля 2020

Возможно, вам придется создать его самостоятельно, или для этого нужно использовать statsmodel. Согласно sklearn docs: docs , у него нет этого conf inte.
Или вы можете следовать этому руководству: medium

Получите доверительный интервал от склеарнской линейной регрессии в python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получите доверительный интервал от склеарнской линейной регрессии в python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы