Предельные категории в гистограмме для R - PullRequest
0 голосов
/ 20 марта 2019

У меня проблемы с функцией гистограммы в R.

У меня есть набор данных с количеством людей в каждом наборе, значения которого находятся в диапазоне от 0 до 17. Я хочу разделить их на категории (0-4,5-9,10-14 и т. Д.), Потому что это справедливо, так как каждая категория включает 5 чисел.

Однако, когда я использую функцию hist в R, она автоматически попадает в0-5,6-10,11-15 и т.д ... что не то, что я хочу.Я пробовал "seq" и "break" в функции гистограммы, но у меня это не получалось.

Есть ли у вас какие-либо идеи / предложения по управлению моей гистограммой?Как вы думаете, это нормально - 0-4,5-9 и т. Д., Или вы считаете, что R правильно обрабатывает мои данные?

Я не хочу разбивать на более мелкие ячейки, как хочу провеститест хи-квадрат с моими данными и слишком большим количеством категорий приведет к меньшему ожидаемому значению.

hist(data,main="Histogram", xlab = "individuals", 
     ylab ="Count", border="black", col="red", xlim=c(0,20), ylim=c(0,10))


Set Individuals
1   2
2   5
3   9
4   6
5   17
6   2
7   13
8   6
9   0
10  1
11  2
12  1
13  2
14  2
15  15

1 Ответ

0 голосов
/ 20 марта 2019

Вы можете использовать аргумент breaks из функции Hist для настройки ваших корзин.Вам необходимо предоставить список с изменяющимися значениями.Поэтому, если у вас есть целое число и вы хотите иметь 0-4, 5-9 ... Вы можете использовать (с данными от 0 до 10 здесь):

> seq(-0.5, max(data)+5, 5)
[1] -0.5  4.5  9.5 14.5

И затем с любыми другими аргументами вашеговыбирая:

hist(data, breaks=seq(-0.5,max(data)+5,5))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...