Извлечение определенных номеров строк на основе повторения? - PullRequest
0 голосов
/ 03 февраля 2019

У меня есть фрейм данных -mydata-, включающий более 2000 строк, примерно так:

Id  Name    Score
R1  sam       76
R1  Sosan     8
...      ...     ...
R4   jack     2
R4   Tom      76
R4   samy     8
R5   Check    9 
…     ...     ..
R6     Anderson   2
...       ...     ..

Теперь я хочу извлечь идентификаторы, которые повторяются больше определенного числа, например 4. Iможет извлечь размер уникальных чисел по группам и размеру, например так:

Mydata.groupby(by=[‘Id’]).size()

Но я не могу извлечь только идентификаторы на основе порога.

1 Ответ

0 голосов
/ 03 февраля 2019

Вы можете попробовать использовать value_counts, который считает вхождение Id, затем отфильтруйте результат, который равен Series, по количеству вхождений:

num = 2
s = df['Id'].value_counts()
print(s[s>num].index.values)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...