У меня есть следующая игрушка df:
FilterSystemO2Concentration (Percentage) ProcessChamberHumidityAbsolute (g/m3) ProcessChamberPressure (mbar)
0 0.156 1 29.5 28.4 29.6 28.4
2 0.149 1.3 29.567 28.9
3 0.149 1 29.567 28.9
4 0.148 1.6 29.6 29.4
Это всего лишь образец.Оригинал имеет более 1200 строк.Какой лучший способ отобрать его, сохранив его статистические свойства?
Я некоторое время гуглял, и мне встречались только алгоритмы передискретизации для несбалансированных классов.но это не то, чего я хочу, мне все равно не интересно балансировать данные, я просто хотел бы произвести больше выборок таким образом, чтобы более или менее сохранить исходное распределение данных и статистические свойства.
Спасибо зазаранее