Pandas scatter_matrix plotting - дополнительные аргументы - PullRequest
0 голосов
/ 03 октября 2018

Я использую Python 3.6 с версией Pandas 0.19.2.На приведенном ниже примере кода у меня есть два вопроса относительно функции построения графиков Панд scatter_matrix():

** 1. ** Как я могу обозначить цвета наблюдениями на точечных диаграммах относительно Labelстолбец?

** 2. ** Как указать количество бинов для гистограмм на диагонали?Могу ли я сделать это индивидуально или только один номер корзины для всех?

import pandas as pd
import numpy as np

N= 1000
df_feat = pd.DataFrame(np.random.randn(N, 4), columns=['A','B','C','D'])
df_label = pd.DataFrame(np.random.choice([0,1], N), columns=['Label'])
df = pd.concat([df_feat, df_label], axis=1)
axes = pd.tools.plotting.scatter_matrix(df, alpha=0.2)

Это связано с этим более общим одним.

1 Ответ

0 голосов
/ 03 октября 2018

Чтобы ответить на ваш первый вопрос, может быть менее «клуджевый» способ, но

scatter_matrix(df,c=['r' if i == 1 else 'b' for i in df['Label']])

Для ответа на второй:

Матрица рассеяния можетиспользуйте pd.hist () api для использования исторических ключевых слов, переданных в словаре

scatter_matrix(df,hist_kwds={'bins':5})

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...