При реализации OLS в множественной регрессии с зависимой переменной и тремя независимыми переменными встречается следующий код
PatsyError: Коэффициент оценки ошибки: IndexError: только целые числа, срезы (:
) , многоточие (...
), numpy .newaxis (None
) и целые или логические массивы являются действительными индексами
y ~ X1
^
#Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# Importing the dataset
dataset = pd.read_csv('data1.csv')
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 3].values
# Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)
# Fitting Multiple Linear Regression to the Training set
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# Predicting the Test set results
y_pred = regressor.predict(X_test)
#OLS for multiple regression
import statsmodels.formula.api as sm
from statsmodels.api import add_constant
X1= add_constant(X)
regressor_OLS = sm.ols(formula = 'y ~ X1', data = X1)
regressor_OLSm = regressor_OLS.fit()
print(regressor_OLSm.summary())
введите описание изображения здесь