Я хочу знать, почему?Мой набор данных показывает, что поведение .....
Описание моего набора данных
count 2892.000000
mean 12.054429
std 0.282199
min 10.471978
25% 11.948685
50% 12.081147
75% 12.162767
max 13.275829
Name: SalePrice, dtype: float64
Набор данных Coloums
(['SalePrice', 'GrLivArea', 'OverallQual', 'GarageCars', 'GarageArea',
'TotRmsAbvGrd', 'FullBath', 'TotalBsmtSF', '1stFlrSF', 'YearBuilt',
'YearRemodAdd', 'GarageYrBlt', 'Fireplaces', 'LotArea', 'LotFrontage',
'MasVnrArea', 'BedroomAbvGr', '2ndFlrSF', 'OpenPorchSF', 'BsmtFinSF1'],
dtype='object')
Эта корреляционная матрица говорит нам об отношенияхмежду этими функциями, использующими этот код
corrmat = dataset.corr()
sns.heatmap(corrmat, vmax=.8, square=True)
, но когда мы приближаемся к нескольким переменным, это показывает, что междунесколько функций, ПОЧЕМУ?
Я использую эти строки кода
corrmat = dataset.corr()
k = 15
cols = corrmat.nlargest(k, dependentVariable)[dependentVariable].index
print(cols)
cm = np.corrcoef(dataset[cols].values.T)
sns.set(font_scale=1)
sns.heatmap(cm, cbar=True, annot=True, square=True, fmt='.2f',
annot_kws={'size': 8}, yticklabels=cols.values,
xticklabels=cols.values)