У меня проблема с группировкой.Я пытаюсь сгруппировать значения из столбца A, и в то же время получить каждое значение столбца C и умножить на 2, а для каждого сгруппированного значения из столбца A рассчитать среднее и, в то же время, выбрать только эти значения из столбцаЭто среднее значение выше 75. После этого я хочу показать блокпост, используя группирование каждого значения из столбца C по столбцу B.
Я просто приведу пример.У меня есть такой фрейм данных:
df=data.frame((cbind(c('01-May', '01-May', '01-May', '02-May', '02-May', '02-May','03-May','03-May','03-May','04-May','04-May','04-May')
,c('15:00', '16:00','17:00','15:00','16:00','17:00','15:00','16:00','17:00','15:00' ,'16:00','17:00')
,c(25,54,34,28,38,48,36,25,34,04,59,22))))
Данные выглядят так:
A B C
01-May 15:00 25
01-May 16:00 54
01-May 17:00 34
02-May 15:00 28
02-May 16:00 38
02-May 17:00 48
03-May 15:00 36
03-May 16:00 25
03-May 17:00 34
04-May 15:00 04
04-May 16:00 59
04-May 17:00 22
Теперь я хочу умножить столбец C на 2.
A B C
01-May 15:00 50
01-May 16:00 108
01-May 17:00 68
02-May 15:00 56
02-May 16:00 76
02-May 17:00 96
03-May 15:00 72
03-May 16:00 50
03-May 17:00 68
04-May 15:00 08
04-May 16:00 118
04-May 17:00 44
ДалееЯ хотел бы видеть рассчитанное среднее значение для каждого дня (столбец A) и выбрать только те, которые означают, что значение выше 75, поэтому:
A C
01-May 75.3
02-May 76
Наконец, я хотел бы показать только эти дни в boxplot(df$B~df$C)
чтобы увидеть, как выглядят прямоугольники для каждого часа (столбец B).
Как я могу группировать таким образом?