Pandas Dataframe: поиск записей, которые имеют общие значения (например, все игры, в которых есть игрок) - PullRequest
0 голосов
/ 15 ноября 2018

У меня есть CSV-файл истории игр для моего бадминтон-клуба. Я хотел бы иметь возможность узнать информацию о играх , в которых содержится данный игрок (например, с кем больше всего играл "Билл"?). Вот пример того, как могут выглядеть два раунда из трех игр:

import pandas as pd
player_data = player_data = pd.DataFrame(data=[
('2018-06-12', 1, 1, 1, 'Adam'),
 ('2018-06-12', 1, 1, 2, 'Bill'),
 ('2018-06-12', 1, 1, 3, 'Cindy'),
 ('2018-06-12', 1, 1, 4, 'Derek'),
 ('2018-06-12', 1, 2, 1, 'Edward'),
 ('2018-06-12', 1, 2, 2, 'Fred'),
 ('2018-06-12', 1, 2, 3, 'George'),
 ('2018-06-12', 1, 2, 4, 'Harry'),
 ('2018-06-12', 1, 3, 1, 'Ian'),
 ('2018-06-12', 1, 3, 2, 'Jack'),
 ('2018-06-12', 1, 3, 3, 'Karl'),
 ('2018-06-12', 1, 3, 4, 'Laura'),
 ('2018-06-12', 2, 1, 1, 'Karl'),
 ('2018-06-12', 2, 1, 2, 'Cindy'),
 ('2018-06-12', 2, 1, 3, 'Bill'),
 ('2018-06-12', 2, 1, 4, 'Derek'),
 ('2018-06-12', 2, 2, 1, 'Max'),
 ('2018-06-12', 2, 2, 2, 'George'),
('2018-06-12', 2, 2, 3, 'Fred'),
 ('2018-06-12', 2, 2, 4, 'Ian'),
 ('2018-06-12', 2, 3, 1, 'Nigel'),
 ('2018-06-12', 3, 3, 2, 'Edward'),
 ('2018-06-12', 3, 3, 3, 'Harry'),
 ('2018-06-12', 3, 3, 4, 'Adam')],   
columns=['Date', 'Round #', 'Court #', 'Space', 'Name'])

Однако, поскольку каждая строка является записью отдельного игрока, просто найдите по имени, например,

player_data.loc[player_data['Name'] == 'Bill']

просто возвращает только отдельные записи Билла, например:

    Date    Round # Court # Space   Name

    1 2018-06-12    1   1   2   Bill
    14 2018-06-12   2   1   3   Bill

... когда мне нужен новый фрейм данных, который содержит ВСЕ записи игр, в которые играл Билл, так что в этом случае он будет отображаться как:

Date    Round # Court # Space   Name
0   2018-06-12  1   1   1   Adam
1   2018-06-12  1   1   2   Bill
2   2018-06-12  1   1   3   Cindy
3   2018-06-12  1   1   4   Derek
12  2018-06-12  2   1   1   Karl
13  2018-06-12  2   1   2   Cindy
14  2018-06-12  2   1   3   Bill
15  2018-06-12  2   1   4   Derek

Я думаю, что может быть проще преобразовать исходный фрейм данных в тот, где каждая запись представляет собой отдельную игру, в которой все имена игроков для этой игры указаны в кортеже, поэтому было бы относительно просто проверить, "если имя в именах "? например

Date    Round # Court # Names
    0   2018-06-12  1   1   (Adam, Bill, Cindy, Derek)

... но возможно это вызовет другие проблемы.

Ответы [ 2 ]

0 голосов
/ 15 ноября 2018

Мой метод для этого:

bill_player_data = player_data.loc[player_data['Name'] == 'Bill']
ro = bill_player_data['Round #']
co = bill_player_data['Court #']
bill = player_data.loc[player_data['Round #'].isin(ro)]
bill = bill.loc[bill['Court #'].isin(co)]
bill
0 голосов
/ 15 ноября 2018

После фильтрации с помощью merge

s1=player_data.loc[player_data['Name'] == 'Bill',['Date','Round #','Court #']]
s2=s1.merge(player_data,how='left')
s2
Out[12]: 
         Date  Round #  Court #  Space   Name
0  2018-06-12        1        1      1   Adam
1  2018-06-12        1        1      2   Bill
2  2018-06-12        1        1      3  Cindy
3  2018-06-12        1        1      4  Derek
4  2018-06-12        2        1      1   Karl
5  2018-06-12        2        1      2  Cindy
6  2018-06-12        2        1      3   Bill
7  2018-06-12        2        1      4  Derek
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...