Как найти идентификатор, который имеет несколько совпадений из данных футбола Kaggle - PullRequest
0 голосов
/ 30 марта 2019

В домашнем задании нас просят найти идентификатор, который имеет несколько совпадений. Также как в базе данных, есть отношения один ко многим

Я мог только указать, что оба идентификатора не совпадают. Так как различный номер счета отличается.

import numpy as np
import pandas as pd
player_att = pd.read_csv('Player_Attributes.csv',sep = ',') 
player_att.head()

player_att.player_fifa_api_id.nunique()  
player_att.player_api_id.nunique()

Для приведенных выше кодов результаты равны 11062, 11060. То есть два идентификатора не совпадают. Но как найти тот, у которого есть несколько fifa_api_id?

1 Ответ

0 голосов
/ 30 марта 2019

Попробуйте:

player_att.groupby('player_fifa_api_id').player_api_id.count()

По сути, groupby соберет все строки с одинаковым player_fifa_api_id вместе, а count вернет номер (количество) каждой группы.

После этого у вас есть серия с именем player_api_id и индексированная player_fifa_api_id. Если вы хотите, чтобы игроки имели более одного player_api_id, вы смотрите серию, в которой значение больше 1.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...