У меня есть данные, которые имеют несколько измерений, одним из которых является тип населения (f
или g
).
При выполнении scatter_matrix
я хотел бы иметь возможность различать ряды населения g
от рядов населения h
(через цвет)
df = pd.DataFrame([['g', 1, 2], ['g', 3, 4], ['f', 5, 6], ['f', 7, 8]], columns=['pop', 'A', 'B'])
pd.plotting.scatter_matrix(df)
pop A B
0 g 1 2
1 g 3 4
2 f 5 6
3 f 7 8
Диаграммы рассеяния не делают различий между точками, и все комбинации построены. Я хотел бы сопоставлять только баллы для данной популяции (и назначать им цвет).
Для приведенного выше случая это означало бы, что на нижней левой диаграмме рассеяния я хотел бы, чтобы точка, соответствующая 1 - 2
и 3 - 4
, была одного цвета (набор данных типа g
) и 5 - 6
и 7 - 8
другой цвет (набор данных типа f
) и