Использование предварительно рассчитанных планок погрешностей с Seaborn и Barplot - PullRequest
0 голосов
/ 09 июля 2020

У меня есть фрейм данных, в котором я предварительно вычислил среднее значение и стандартное отклонение для определенного набора значений. Фрагмент фрейма данных и его создание показано ниже:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

channel = ["Red", "Green", "Blue", "Red", "Green", "Blue", "Red", "Green", "Blue"]
average= [83.438681, 36.512924, 17.826646, 83.763724, 36.689707, 17.892932, 84.747069, 37.072383, 18.070416]
sd = [7.451285, 3.673155, 1.933273, 7.915111, 3.802536, 2.060639, 7.415741, 3.659094, 2.020355]
conc = ["0.00", "0.00", "0.00", "0.25", "0.25", "0.25", "0.50", "0.50", "0.50"]

df = pd.DataFrame({"channel": channel,
                  "average": average,
                  "sd" : sd,
                  "conc": conc})

order = ["0.00", "0.25", "0.50"]
sns.barplot(x="conc", y="average", hue="channel", data=df, ci=None, order=order);

Выполнение приведенного выше кода приводит к изображению, которое выглядит следующим образом:

введите описание изображения здесь

У меня есть столбец sd с предварительно рассчитанным стандартным отклонением, и я хотел бы добавить столбцы ошибок выше и ниже каждого столбца. Однако я не могу понять, как это сделать.

Любая помощь будет принята с благодарностью.

1 Ответ

1 голос
/ 10 июля 2020

Вчера столкнулся с этой ошибкой. Я считаю, что в seaborn нельзя добавлять планки ошибок, основанные на заранее определенных ошибках. Самое простое решение - построить диаграмму matplotlib поверх морского графика.

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

channel = ["Red", "Green", "Blue", "Red", "Green", "Blue", "Red", "Green", "Blue"]
average= [83.438681, 36.512924, 17.826646, 83.763724, 36.689707, 17.892932, 84.747069, 37.072383, 18.070416]
sd = [7.451285, 3.673155, 1.933273, 7.915111, 3.802536, 2.060639, 7.415741, 3.659094, 2.020355]
conc = ["0.00", "0.00", "0.00", "0.25", "0.25", "0.25", "0.50", "0.50", "0.50"]

df = pd.DataFrame({"channel": channel,
                  "average": average,
                  "sd" : sd,
                  "conc": conc})

order = ["0.00", "0.25", "0.50"]
sns.barplot(x="conc", y="average", hue="channel", data=df, ci=None, 
            order=order)


conc2=[0,0,0,1,1,1,2,2,2]
width = .25
add = [-1*width, 0 , width, -1*width, 0 , width, -1*width, 0 , width,]
x = np.array(conc2)+np.array(add)

plt.errorbar(x = x, y = df['average'],
            yerr=df['sd'], fmt='none', c= 'black', capsize = 2)
plt.show()

Немного глупо, но работает!

...