У меня есть CSV-файл истории игр для моего бадминтон-клуба. Я хотел бы иметь возможность узнать информацию о играх , в которых содержится данный игрок (например, с кем больше всего играл "Билл"?). Вот пример того, как могут выглядеть два раунда из трех игр:
import pandas as pd
player_data = player_data = pd.DataFrame(data=[
('2018-06-12', 1, 1, 1, 'Adam'),
('2018-06-12', 1, 1, 2, 'Bill'),
('2018-06-12', 1, 1, 3, 'Cindy'),
('2018-06-12', 1, 1, 4, 'Derek'),
('2018-06-12', 1, 2, 1, 'Edward'),
('2018-06-12', 1, 2, 2, 'Fred'),
('2018-06-12', 1, 2, 3, 'George'),
('2018-06-12', 1, 2, 4, 'Harry'),
('2018-06-12', 1, 3, 1, 'Ian'),
('2018-06-12', 1, 3, 2, 'Jack'),
('2018-06-12', 1, 3, 3, 'Karl'),
('2018-06-12', 1, 3, 4, 'Laura'),
('2018-06-12', 2, 1, 1, 'Karl'),
('2018-06-12', 2, 1, 2, 'Cindy'),
('2018-06-12', 2, 1, 3, 'Bill'),
('2018-06-12', 2, 1, 4, 'Derek'),
('2018-06-12', 2, 2, 1, 'Max'),
('2018-06-12', 2, 2, 2, 'George'),
('2018-06-12', 2, 2, 3, 'Fred'),
('2018-06-12', 2, 2, 4, 'Ian'),
('2018-06-12', 2, 3, 1, 'Nigel'),
('2018-06-12', 3, 3, 2, 'Edward'),
('2018-06-12', 3, 3, 3, 'Harry'),
('2018-06-12', 3, 3, 4, 'Adam')],
columns=['Date', 'Round #', 'Court #', 'Space', 'Name'])
Однако, поскольку каждая строка является записью отдельного игрока, просто найдите по имени, например,
player_data.loc[player_data['Name'] == 'Bill']
просто возвращает только отдельные записи Билла, например:
Date Round # Court # Space Name
1 2018-06-12 1 1 2 Bill
14 2018-06-12 2 1 3 Bill
... когда мне нужен новый фрейм данных, который содержит ВСЕ записи игр, в которые играл Билл, так что в этом случае он будет отображаться как:
Date Round # Court # Space Name
0 2018-06-12 1 1 1 Adam
1 2018-06-12 1 1 2 Bill
2 2018-06-12 1 1 3 Cindy
3 2018-06-12 1 1 4 Derek
12 2018-06-12 2 1 1 Karl
13 2018-06-12 2 1 2 Cindy
14 2018-06-12 2 1 3 Bill
15 2018-06-12 2 1 4 Derek
Я думаю, что может быть проще преобразовать исходный фрейм данных в тот, где каждая запись представляет собой отдельную игру, в которой все имена игроков для этой игры указаны в кортеже, поэтому было бы относительно просто проверить, "если имя в именах "? например
Date Round # Court # Names
0 2018-06-12 1 1 (Adam, Bill, Cindy, Derek)
... но возможно это вызовет другие проблемы.