Что делает метод .corr () в Pandas и как он связан с тепловой картой? - PullRequest
0 голосов
/ 18 апреля 2020

Я делал урок об EDA, используя галерею jupyter, и обнаружил, что этот код сбивает с толку: -

plt.figure(figsize=(10,5))
c = df.corr()
sns.heatmap(c,cmap="BrBG", annot=True)

Здесь фрейм данных определен как df. Тем не менее, я не понимаю цели df.corr () и как это связано с тепловой картой. Я попытался выполнить поиск df.corr () и обнаружил, что он используется для выполнения парных операций.

Вот ссылка на галерею jupyter: https://colab.research.google.com/github/Tanu-N-Prabhu/Python/blob/master/Exploratory_data_Analysis.ipynb#scrollTo = dAnd4DSyeHDb

Будет цените ясность по моим вопросам.

Ответы [ 2 ]

0 голосов
/ 18 апреля 2020

.corr () находит корреляцию между каждым столбцом (переменной) в кадре данных друг с другом, возвращает 2D-матрицу данных.

corr = df.corr() // df - мой фрейм данных

Значения данных представлены в виде цветов на тепловой карте. Целью тепловой карты является предоставление цветной визуальной сводки информации.

plt.figure(figsize= (20,22)) sns.set(font_scale=1.5) sns.heatmap(corr, annot=True) plt.show()

0 голосов
/ 18 апреля 2020

df.corr() вычисляет матрицу корреляции, диапазон элементов которой равен [-1, 1], по умолчанию используется коэффициент корреляции Пирсона. sns.heatmap - это просто способ показать с помощью цветов, насколько сильны корреляции, где зеленый цвет в этом случае предполагает положительную корреляцию, близкую к 1.

Это просто способ увидеть корреляции с цветами вместо числа, чтобы пользователь мог определить, какие переменные являются более коррелированными.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...