Я не совсем уверен, какое название подходит для моего вопроса
Итак, вот вопрос
Предположим, у меня есть N образцов, например:
1
2
3
4
,
,
,
N
Теперь я хочу «уменьшить» размер выборки с N до M путем сброса (N-M) данных из N выборок.
Я хочу, чтобы сброс был как можно более "распределенным",
Например, если у меня есть 100 сэмплов и я хочу сжать их до 50, я бы выбрасывал все остальные сэмплы. Другой пример, скажем, данные представляют собой 100 выборок, и я хочу сжать их до 25 выборок. Я бы выбрасывал 1 образец в каждой группе из 100/25 образцов, что означает, что я перебираю каждый образец и счет, и каждый раз, когда мой счет достигает 4, я выбрасываю образец и перезапускаю счет.
Проблема в том, как мне сделать это, если 4 выше должно быть, например, 2.333. Как мне обработать десятичную точку, чтобы распределить выборку?
Большое спасибо ..