Гистограмма Корреляция Specifi c Колонка - PullRequest
1 голос
/ 12 января 2020

У меня есть CSV-файл, который имеет 36 столбцов, я хотел сохранить один столбец постоянным и найти корреляцию гистограммы между ним и оставшимися 35 оставшимися столбцами, но я не мог понять, как выбрать этот отдельный столбец

Я сделал прототип файла CSV, который состоит из 4 столбцов и 4 строк. http://www.filedropper.com/finalcombine

Спасибо.

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

%matplotlib inline

df = pd.read_csv('D:\\Project\\database\\FinalCombine.csv')

fig, ax = plt.subplots(figsize=(50,35))

sns.distplot(df.corr(),y='Power_KW',color='g')

sns.plt.show()

1 Ответ

1 голос
/ 15 января 2020

Согласно документации для corr:

Возвращенное значение df является корреляционной матрицей. Вы должны выбрать указанные c строки и столбцы для визуализации.

Итак, обновив ваш пример:

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

%matplotlib inline

df = pd.read_csv('D:\\Project\\database\\FinalCombine.csv')
fig, ax = plt.subplots(figsize=(50,35))
sns.distplot(df.corr()['A'],y='Power_KW',color='g')
sns.plt.show()

Это построит график корреляции между столбцом A и остальными колонны, включая себя.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...