У меня есть Dataframe, который столбец, который содержит идентификатор. Этот идентификатор представляет человека и может присутствовать много раз:
col_id col2 col3 col4....
row1 1
row2 1
row3 2
row4 3
row5 3
row6 3
row7 1
row8 7
Мне нужно вернуть новый фрейм данных, где значение value_counts столбца ID больше, чем, скажем, 2.
Новый фрейм данных:
col_id col2 col3 col4....
row1 1
row2 1
row3 3
row4 3
row5 3
row6 1
Этот новый фрейм данных содержит строки, в которых число идентификаторов превышает только 2.
Редактировать
Отсюда мне нужно отделить данные по ID. В идеале я хотел бы получить решение, в котором бы для каждого идентификатора имелся фрейм данных:
Dataframe 1
col_id col2 col3 col4....
r1 1
r2 1
r3 1
Датафрейм 2
col_id col2 col3 col4....
r1 2
r2 2
r3 2
Датафрейм 3
col_id col2 col3 col4....
r1 3
r2 3
r3 3
Можно ли объединить их в один большой массив данных? Таким образом, у меня может быть новый столбец, называемый «индекс», который содержит строки для идентификатора == 1, идентификатора == 2 и т. Д .:
index
1 col_id col2 col3 col4....
r1 1
r2 1
r3 1
index
2 col_id col2 col3 col4....
r1 2
r2 2
r3 2
index
3 col_id col2 col3 col4....
r1 3
r2 3
r3 3