У меня есть набор данных с несколькими строками. Я хочу создать новый набор данных, основанный на количестве повторяющихся строк для столбца. Для первого набора данных я хочу, чтобы набор данных не содержал повторяющихся строк, то есть только строку с одним значением. Для второго набора данных мне нужны две повторяющиеся строки и три повторяющиеся строки, но только до второй. Для третьего набора данных я хочу набор данных только с тремя дублирующимися строками. В качестве примера я написал коды для описания этой ситуации. Допустим, у меня есть такой фрейм данных
x = {'column1': ['a','a','b','b','b','c','c','c','d'],
'column2': [22000,25000,27000,350,0,3,5,4,312]
}
df = pd.DataFrame(x, columns = ['column1', 'column2'])
print (df)
Первый набор данных должен выглядеть так:
x = {'column1': ['d'],
'column2': [312]
}
df = pd.DataFrame(x, columns = ['column1', 'column2'])
print (df)
Второй набор данных должен выглядеть следующим образом:
x = {'column1': ['a','a','b','b','c','c'],
'column2': [22000,25000,27000,350,3,5]
}
df = pd.DataFrame(x, columns = ['column1', 'column2'])
print (df)
Третий набор данных должен выглядеть следующим образом:
x = {'column1': ['b','b','b','c','c','c'],
'column2': [27000,350,0,3,5,4]
}
df = pd.DataFrame(x, columns = ['column1', 'column2'])
print (df)
Как бы это сделать не вручную?