Предположим, у меня есть кадр данных Pandas, df
, который имеет следующую структуру: -
Column 1 Column 2 .... Column 100
Row 1 0.233 0.555 0
Row 2 0.231 0.514 2
..
Row 15000 0.232 0.455 3
Column 100
представляет определенный класс, к которому принадлежит каждая строка (может быть от 0-14
). Каждая категория / класс имеет 1000
строк, связанных с ним. Для каждой категории (обозначенной целыми числами в Column 100
) я хочу выбрать случайным образом только 200
выборок и создать новый фрейм данных df_new
, который будет иметь новое измерение 15x200 = 3000 rows
. Есть ли хороший способ достичь этого?