R + ggplot2 - агрегирование данных по интервалам - PullRequest
3 голосов
/ 18 апреля 2011

У меня есть файл, в котором в каждой строке есть числовое значение, символизирующее среднюю продолжительность:

12.3
5.4
6
...

В R есть какой-то способ для отображения данных в автоматических или ручных интервалах / перерывах (агрегат?).Примерно так:

[0,1[ 0
[1, 6[ 1
[6, 20[ 2
...

Кроме того, затем я хочу создать график в ggplot2, показывающий эти данные.Могу ли я использовать эти интервалы в качестве меток?

1 Ответ

4 голосов
/ 18 апреля 2011

Вы можете скопировать данные с помощью функции cut() в базе R или использовать пакет Hmisc и cut2().Существует несколько вариантов того, как выполнять нарезку и нарезку ваших данных, каждый из которых описан в help(cut) или help(cut2) соответственно.

Как только вы соответствующим образом скомпонуете свои данные, построение графика с помощью ggplot станет тривиальнымупражнение:

library(ggplot2)
#Sample data
set.seed(1)
dat <- data.frame(x = sample(1:100, 1000, TRUE))
dat$cuts <- cut(dat$x, breaks = 5)

#Make bar chart
qplot(dat$cuts)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...