scatter_matrix показывает не все столбцы - PullRequest
0 голосов
/ 31 августа 2018

У меня есть некоторые проблемы с моими scatter_matrix участками.

В основном у меня есть датафрейм df, состоящий из 19 столбцов, т.е.

df.columns = ['A','B',...'S']

Столбец «A» содержит только значения int от 1 до 2. Scatter_matrix применяется к df

pd.plotting.scatter_matrix(df,diagonal = 'kde', ax = ax_values1_2)

возвращает нужный матричный график 19x19 .

Если я разделю фрейм данных на два отдельных фрейма данных df_1 и df_2, которые состоят из одних и тех же данных, за исключением того, что df_1 состоит из всех значений, где df.A = 1 и аналог df_2 получили значения, где df.A=2.

Если я теперь применю scatter_matrix к этим новым фреймам данных:

pd.plotting.scatter_matrix(df_1,diagonal = 'kde', ax = ax_values1_2)
pd.plotting.scatter_matrix(df_2,diagonal = 'kde', ax = ax_values1_2)

Я получаю 2 метрики размером 9x9 .

Так что я предполагаю, что scatter_matrix отфильтровывает строки из графика, где, кажется, нет соответствующей информации. Я прав в этом месте?

Итак, мой вопрос: как заставить scatter_matrix построить полные столбцы 19, даже если в этом нет никакого смысла.

Может быть, есть какой-то теоретический или простой ответ на эту проблему. Если нет, я мог бы дополнительно предоставить Код, который вызывает проблему.

1 Ответ

0 голосов
/ 07 сентября 2018

Спасибо за все советы по улучшению качества обращения за помощью.

Тем временем я нашел решение для моей проблемы. В случае, если кто-то еще столкнется с той же проблемой, решение для меня было изменить параметр diagonal в scatter_matrix на hist.

Кажется, что scatter_matrix не будет выбрасывать столбцы с одним единственным значением в столбце, если выбрано hist.

...