Хотите MultiIndex для строк и столбцов с read_csv - PullRequest
0 голосов
/ 21 сентября 2018

Мой файл .csv выглядит так:

Area    When    Year    Month   Tickets
City    Day     2015    1       14
City    Night   2015    1       5
Rural   Day     2015    1       18
Rural   Night   2015    1       21
Suburbs Day     2015    1       15
Suburbs Night   2015    1       21
City    Day     2015    2       13

, содержащий 75 строк.Я хочу, чтобы мультииндекс строки и столбец мультииндекса выглядели так:

Area         City        Rural         Suburbs
When         Day Night   Day Night     Day Night
Year Month
2015 1       5.0   3.0  22.0  11.0    13.0   2.0
     2      22.0   8.0   4.0  16.0     6.0  18.0
     3      26.0  25.0  22.0  23.0    22.0   2.0
2016 1      20.0  25.0  39.0  14.0     3.0  10.0
     2       4.0  14.0  16.0  26.0     1.0  24.0
     3      22.0  17.0   7.0  24.0    12.0  20.0 

Я прочитал документ .read_csv по адресу https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

Я могу получить мультииндекс индекса строки с помощью:

df2 = pd.read_csv('c:\\Data\Tickets.csv', index_col=[2, 3])

Я пробовал:

df2 = pd.read_csv('c:\\Data\Tickets.csv', index_col=[2, 3], header=[1, 3, 5])

, думая [1, 3, 5], выбирает «Город», «Сельская местность» и «Пригород».Как получить желаемый столбец мультииндекса, показанный выше?

1 Ответ

0 голосов
/ 21 сентября 2018

Похоже, вам нужно pivot_table с несколькими индексами и с несколькими столбцами.

Начните с простого чтения csv просто

df = pd.read_csv('Tickets.csv')

Затем

df.pivot_table(index=['Year', 'Month'], columns=['Area', 'When'], values=['Tickets'])

С предоставленными вами входными данными вы получите

Area             City           Rural            Suburbs
When             Day    Night   Day     Night    Day    Night
Year    Month                       
2015    1        14.0   5.0     18.0    21.0     15.0   21.0
        2        13.0   NaN     NaN     NaN      NaN    NaN
...