построить групповой объект с боке - PullRequest
0 голосов
/ 09 апреля 2019

Рассмотрим следующее MWE.

from pandas import DataFrame
from bokeh.plotting import figure
data = dict(x = [0,1,2,0,1,2],
            y = [0,1,2,4,5,6],
            g = [1,1,1,2,2,2])
df = DataFrame(data)
p = figure()
p.line( 'x', 'y', source=df[ df.g == 1 ] )
p.line( 'x', 'y', source=df[ df.g == 2 ] )

В идеале я хотел бы сжать последние до одной строки:

p.line( 'x', 'y', source=df.groupby('g') )

(Примеры из реальной жизни содержат большое и переменное количество групп.) Есть ли какой-то краткийспособ сделать это?

Ответы [ 3 ]

1 голос
/ 09 апреля 2019

Я не вышел с df.groupby, поэтому я использовал df.loc, но, возможно, multi_line - это то, что вам нужно:

from pandas import DataFrame
from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource

data = dict(x = [0, 1, 2, 0, 1, 2],
            y = [0, 1, 2, 4, 5, 6],
            g = [1, 1, 1, 2, 2, 2])

df = DataFrame(data, index = data['g'])
dfs = [DataFrame(df.loc[i].values, columns = df.columns) for i in df['g'].unique()]
source = ColumnDataSource(dict(x = [df['x'].values  for df in dfs], y = [df['y'].values for df in dfs]))

p = figure()
p.multi_line('x', 'y', source = source)

show(p)

Результат:

enter image description here

1 голос
/ 09 апреля 2019

Это решение Тони, слегка упрощенное.

import pandas as pd
from bokeh.plotting import figure
data = dict(x = [0, 1, 2, 0, 1, 2],
            y = [0, 1, 2, 4, 5, 6],
            g = [1, 1, 1, 2, 2, 2])
df = pd.DataFrame(data)
####################### So far as in the OP
gby = df.groupby('g')
p = figure()
x = [list( sdf['x'] ) for i,sdf in gby]
y = [list( sdf['y'] ) for i,sdf in gby]
p.multi_line( x, y )
1 голос
/ 09 апреля 2019

Я только что узнал, что работает следующее

gby = df.groupby('g')
gby.apply( lambda d: p.line( 'x', 'y', source=d ) )

(хотя и имеет некоторые недостатки).

Есть идея получше?

...