R: проблема биннинга в кратной постоянной ширины - PullRequest
0 голосов
/ 25 февраля 2019

Я искал пакеты для резки или биннинга R, но я не мог найти то, что мне действительно нужно.

У меня есть набор данных из 1000 переменных, и для некоторых столбцов они могут иметь значения в диапазоне от 0,01 до 0,2, но для некоторых других они могут иметь диапазон от 0 до 2000. Некоторые, с другой стороны, могут содержать отрицательные числа.

Я хотел бы построить гистограмму для каждой из переменных, но с более последовательной меткой биннинга, т.е. я хотел бы, чтобы ширина бина была кратна 1,2,5 или 5 (для десятичных чисел может быть 0,01, 0,02 или 0,05), и я могу варьировать номера бинов от 20 до 40 бинов (их можно исправить, если это проще) и не беспокоиться о количестве данных в каждом бине.

Причинаэто потому, что я мог бы получить некоторые новые данные для тех же переменных, и я хотел бы иметь последовательное сопоставление их распределения и, возможно, моделирование результатов в одном и том же хранилище.А переменных просто слишком много, и я не смог бы сделать их вручную.

Есть мысли о том, как написать для этого функцию, которая будет возвращать корзины в соответствии со старыми и новыми данными, прежде чем я получу новые данные.

...