Я хочу построить логистическую регрессию и извлечь p-значение члена взаимодействия в Python, где набор данных импортируется из Teradata.Но здесь появляется сообщение об ошибке, с которым я не уверен, что делать.
Я пробовал два разных способа построения модели логистической регрессии.Первый способ не может распечатать команду model.summary (), поэтому пробовал второй способ.Все переменные include были преобразованы в str, и все они являются категориальными переменными.
import pandas as pd
import numpy as np
import seaborn as sns; sns.set()
from sklearn.linear_model import LogisticRegression
import sklearn.linear_model as lm
from sklearn.preprocessing import PolynomialFeatures
from sklearn.metrics import classification_report
import statsmodels.api as sm
import statsmodels.formula.api as smf
from patsy import dmatrices;
y = testing.respond
feature_cols = ['t1', 't2', 'inter']
X = testing[feature_cols].as_matrix()
import warnings
warnings.filterwarnings("ignore", category=FutureWarning)
model = LogisticRegression(solver='lbfgs')
result = model.fit(X,y)
result.summary
AttributeError: 'LogisticRegression' object has no attribute 'summary'
model = sm.Logit(y, X)
model_fit = model.fit()
print(model_fit.summary)
ValueError: Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).
Хотите знать, как я могу исправить любую из моделей, чтобы получить результат из термина inter-value