Как сделать джиттерплот на матплолиб python - PullRequest
0 голосов
/ 14 февраля 2020

Вот мой код (адаптированный с здесь ):

df_1 = pd.DataFrame({'Cells' : np.arange(0,100), 'Delta_7' : np.random.rand(100,), 'Delta_10' : np.random.rand(100,), 'Delta_14' : np.random.rand(100,)}, columns = ['Cells','Delta_7', 'Delta_10', 'Delta_14'])



#figure
fig, ax1 = plt.subplots()
fig.set_size_inches(13, 10)



#c sequence
c = df_1['Delta_7']

#plot

plt.scatter(np.full((len(df_1), 1), 1), df_1['Delta_7'] , s = 50, c=c, cmap = 'viridis')
plt.scatter(np.full((len(df_1), 1), 2), df_1['Delta_10'] , s = 50, c=c, cmap = 'viridis')
plt.scatter(np.full((len(df_1), 1), 3), df_1['Delta_14'] , s = 50, c=c, cmap = 'viridis')
cbar = plt.colorbar()

Я хотел бы сделать красивый джиттерпот (например, на R или Сиборн ) с матплотлиб. Дело в том, что я хотел бы дать каждой ячейке цвет, основанный на ее значении Delta_7. И этот цвет будет сохранен при построении «Delta_10» и «Delta_14», что мне не удалось сделать с Seaborn. Пожалуйста, не могли бы вы дать мне знать, если у вас есть какие-либо подсказки (python пакет, уловки кодирования ...)?

Пожалуйста,

1 Ответ

1 голос
/ 14 февраля 2020

Положение точек можно получить из списка, возвращенного scatter. Эти позиции могут колебаться, например, только в направлении х. Возможно, диапазон оси X нужно немного расширить, чтобы показать каждую смещенную точку.

Вот код, который нужно начать экспериментировать:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

def jitter_dots(dots):
    offsets = dots.get_offsets()
    jittered_offsets = offsets
    # only jitter in the x-direction
    jittered_offsets[:, 0] += np.random.uniform(-0.3, 0.3, offsets.shape[0])
    dots.set_offsets(jittered_offsets)

df_1 = pd.DataFrame({'Cells': np.arange(0, 100),
                     'Delta_7': np.random.rand(100),
                     'Delta_10': np.random.rand(100),
                     'Delta_14': np.random.rand(100)})
fig, ax1 = plt.subplots()

columns = df_1.columns[1:]
c = df_1['Delta_7']
for i, column in enumerate(columns):
    dots = plt.scatter(np.full((len(df_1), 1), i), df_1[column], s=50, c=c, cmap='plasma')
    jitter_dots(dots)
plt.xticks(range(len(columns)), columns)
xmin, xmax = plt.xlim()
plt.xlim(xmin - 0.3, xmax + 0.3)  # make some room to show the jittered dots
cbar = plt.colorbar()
plt.show()

sample result

...