Номинальная стоимость вопросника для нескольких данных - как агрегировать - PullRequest
0 голосов
/ 21 января 2019

У меня есть данные во временных интервалах.

ds = [ds01, ds02, ds03, ds04, ...]

для результатов в цикле, используя:

nhelp = []
for d in ds:
    nhelp.append(d.groupby(list(d)[1]).size().sum)  #single column
nhelp

например. для любимого цвета (данные которого представлены как 1 2 3 ... в вопроснике) здесь я получаю:

[<bound method Series.sum of color
1.0    215
2.0    202
3.0    215
4.0    178
dtype: int64>, <bound method Series.sum of color
1.0    252
2.0    244
3.0    241
4.0    133
dtype: int64>, <bound method Series.sum of color
........ 
dtype: int64>]

Теперь я хочу суммировать цвета для всех периодов времени и показать результаты на одной диаграмме. (Здесь я попробовал pivot, crosstable, loops, - преобразование списка в массив или / и в dataframe - суммирование и построение не удалось. Также невозможно перебрать эту переменную, но я могу получить доступ к значению, например, nhelp [1] [1])

1 Ответ

0 голосов
/ 21 января 2019

Я полагаю, вам нужно объединить все данные на concat, а затем суммировать на Index:

nhelp = []
for d in ds:
    nhelp.append(d.groupby(list(d)[1]).size())

out = pd.concat(nhelp).sum(level=0)

Или составить список:

nhelp = [d.groupby(list(d)[1]).size() for d in ds]
out = pd.concat(nhelp).sum(level=0)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...