Термин р-значение взаимодействия логистической регрессии в питоне - PullRequest
0 голосов
/ 03 июля 2019

Я хочу построить логистическую регрессию и извлечь p-значение члена взаимодействия в Python, где набор данных импортируется из Teradata.Но здесь появляется сообщение об ошибке, с которым я не уверен, что делать.

Я пробовал два разных способа построения модели логистической регрессии.Первый способ не может распечатать команду model.summary (), поэтому пробовал второй способ.Все переменные include были преобразованы в str, и все они являются категориальными переменными.

import pandas as pd
import numpy as np
import seaborn as sns; sns.set()
from sklearn.linear_model import LogisticRegression
import sklearn.linear_model as lm
from sklearn.preprocessing import PolynomialFeatures
from sklearn.metrics import classification_report
import statsmodels.api as sm
import statsmodels.formula.api as smf
from patsy import dmatrices;

y = testing.respond
feature_cols = ['t1', 't2', 'inter']
X = testing[feature_cols].as_matrix()

import warnings
warnings.filterwarnings("ignore", category=FutureWarning)
model = LogisticRegression(solver='lbfgs')
result = model.fit(X,y)
result.summary
AttributeError: 'LogisticRegression' object has no attribute 'summary'

model = sm.Logit(y, X)
model_fit = model.fit()
print(model_fit.summary)
ValueError: Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).

Хотите знать, как я могу исправить любую из моделей, чтобы получить результат из термина inter-value

...