KeyError при индексации на пандах MultiIndex DataFrame - PullRequest
0 голосов
/ 08 января 2019

Следующий пример из документов работает как положено:

s = pd.Series([1, 2, 3, 4, 5, 6],index=pd.MultiIndex.from_product([["A", "B"], ["c", "d", "e"]]))

s['A']

c    1
d    2
e    3

Однако, для этого примера, по моим данным, такая индексация вызывает ошибку:

df = pd.DataFrame({'client_id': {('foo', '2018-01-29'): '1',
  ('bar', '2018-01-29'): '1',
  ('baz', '2018-01-29'): '1',
  ('alice', '2018-01-29'): '1',
  ('bob', '2018-01-29'): '1'}})

df['alice']

KeyError: 'alice'

Что я делаю не так?

1 Ответ

0 голосов
/ 08 января 2019

Просто используйте loc:

df.loc['alice']

           client_id
2018-01-29         1

Пандам не ясно, является ли "Алиса" столбцом или нет с df. С серией ясно, что вызов __getitem__ обращается к индексу.


Другие альтернативы (согласно Как мне нарезать или фильтровать уровни MultiIndex DataFrame? ):

df.loc(axis=0)['alice']

           client_id
2018-01-29         1

df.xs('alice')

           client_id
2018-01-29         1

df.query('ilevel_0 == "alice"')

                 client_id
alice 2018-01-29         1
...