Как добавить легенду в ggplot / plotnine для нескольких кривых - PullRequest
1 голос
/ 14 июля 2020

Вот пример кода, который я использую для построения двух кривых. Как добавить в сюжет легенды? Я видел сообщение, в котором предлагалось добавить цвет в пределах aes , но это вызывало исключение

plotnine.exceptions.PlotnineError: «Не удалось оценить сопоставление 'color': ' красный '(исходная ошибка: имя' красный 'не определено) "

from plotnine import *
import numpy as np
import pandas as pd

str_metric = 'metric'
metric = np.array([0.127, 0.1715, 0.19166667, 0.21583333, 0.24866667, 0.24216667, 0.24433333,
                   0.255, 0.291, 0.30966667, 0.32033333, 0.2415, 0.33833333, 0.30583333, 0.34433333])

metric2 = metric * 2

iterations2 = [i for i in range(len(metric))]


df = pd.DataFrame({'iterations': iterations2,
                   str_metric: metric,
                   str_metric + '2': metric2})

p = ggplot(df, aes(x='iterations')) + geom_smooth(aes(y=metric), color='blue', show_legend=True, method='lm', span=0.10, se=True,
                                                  level=0.80) + geom_smooth(aes(y=metric2), color='red', show_legend=True, method='lm', span=0.10, se=True, level=0.80)
ggsave(p, filename='stackoverflow.png', path='plots/')

1 Ответ

1 голос
/ 16 июля 2020

Вы ошибаетесь. Plotnine лучше всего работает с аккуратными данными , т.е. каждая переменная представляет собой столбец, а каждое наблюдение - строку. В противном случае вы, скорее всего, столкнетесь с проблемой построения графика.

from plotnine import *
import numpy as np
import pandas as pd

str_metric = 'metric'
metric = np.array([0.127, 0.1715, 0.19166667, 0.21583333, 0.24866667, 0.24216667, 0.24433333,
                   0.255, 0.291, 0.30966667, 0.32033333, 0.2415, 0.33833333, 0.30583333, 0.34433333])

metric2 = metric * 2

iterations2 = [i for i in range(len(metric))]

# tidy data
df = pd.DataFrame({
    'iterations': np.hstack([iterations2, iterations2]),
    'value': np.hstack([metric, metric2]),
    'type': np.repeat(['metric', 'metric2'], len(iterations2))   
})

p = (ggplot(df, aes(x='iterations', y='value', color='type'))
     + geom_smooth(method='lm', span=0.10, se=True, level=0.80)
     # Then you can change the colour using a scale
    )

введите описание изображения здесь

...