Переиндексация панд с помощью Multiindex на индекс и столбцы - PullRequest
0 голосов
/ 24 октября 2018

У меня есть длинный фрейм данных с этими столбцами в этом формате:

id  gender  size    region_a_count  region_b_count  item_group
 x   m       x            x                x         x
 x   f       x            x                x         x
 x   f       x            x                x         x
 x   m       x            x                x         x
 x   f       x            x                x         x
 x   m       x            x                x         x   

Каждая комбинация пола, размера, item_group и region уникальна.Таким образом, нет необходимости выполнять агрегацию.

Я хочу переиндексировать индекс и столбцы для этого типа выходных данных, при этом значения ячеек остаются неизменными

                    region_a         region_b        region_c   
                    m        f       m        f      m         f
      (index of size)
item_group  1                       
            2                       
            3                       
item_group  1                       
            2                       
            3                       

То есть синдекс, а также столбцы, имеющие мультииндекс.Мне удалось выполнить эту часть для индекса, вызвав:

df.groupby(["item_group","size"])

Но проблема с колонкой все еще остается.

Как создать мультииндекс из столбца из существующего фрейма данных?

1 Ответ

0 голосов
/ 24 октября 2018

Я считаю, что вам нужно set_index с unstack:

df1 = df.set_index(["item_group","size", "id","gender"]).unstack()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...