Подробнее о наборе данных и поведении корреляционной матрицы? - PullRequest
0 голосов
/ 25 сентября 2019

Я хочу знать, почему?Мой набор данных показывает, что поведение .....

Описание моего набора данных

count    2892.000000
mean       12.054429
std         0.282199
min        10.471978
25%        11.948685
50%        12.081147
75%        12.162767
max        13.275829
Name: SalePrice, dtype: float64

Набор данных Coloums

(['SalePrice', 'GrLivArea', 'OverallQual', 'GarageCars', 'GarageArea',
   'TotRmsAbvGrd', 'FullBath', 'TotalBsmtSF', '1stFlrSF', 'YearBuilt',
   'YearRemodAdd', 'GarageYrBlt', 'Fireplaces', 'LotArea', 'LotFrontage',
   'MasVnrArea', 'BedroomAbvGr', '2ndFlrSF', 'OpenPorchSF', 'BsmtFinSF1'],
  dtype='object')

Эта корреляционная матрица говорит нам об отношенияхмежду этими функциями, использующими этот код

corrmat = dataset.corr()
sns.heatmap(corrmat, vmax=.8, square=True)

enter image description here

, но когда мы приближаемся к нескольким переменным, это показывает, что междунесколько функций, ПОЧЕМУ?

Я использую эти строки кода

corrmat = dataset.corr()
k = 15
cols = corrmat.nlargest(k, dependentVariable)[dependentVariable].index
print(cols)
cm = np.corrcoef(dataset[cols].values.T)
sns.set(font_scale=1)
sns.heatmap(cm, cbar=True, annot=True, square=True, fmt='.2f', 
       annot_kws={'size': 8}, yticklabels=cols.values, 
        xticklabels=cols.values)

enter image description here

...