У меня есть кадр данных pandas, и я хочу сэмплировать значения по весам, и я знаю, что есть функция df.sample
.
Но проблема, которая мне нужна, состоит в том, чтобы получить образец, содержащий N
уникальных элементов в одном из столбцов данных
Может кто-нибудь сделать что-то подобное?
1010 * редактировать *
пример:
У меня есть датафрейм с 1 столбцом:
df = pd.DataFrame([1,1,1,2,3,1,2,1,2,1,4,5,2,3,4,4,5,4])
Я хочу сделать выборку, а в выборке я хочу получить 3 уникальных значения:
возможные конечные результаты:
[1,1,1,2,3,2,3]
Я выбираю 3 разных значения, но размер выборки больше
изменить еще раз
Мне нужно сделать выборку данных, пока у меня не будет N разных значений в 1 столбце