это может быть простой вопрос, но я надеялся, что кто-то может указать мне правильное направление. У меня есть образец набора данных:
dfrm <- list(L = c("A","B","P","C","D","E","P","F"), J=c(2,2,1,2,2,2,1,2), K=c(4,3,10,16,21,3,17,2))
dfrm <-as.data.frame(dfrm)
dfrm
L J K
1 A 2 4
2 B 2 3
3 P 1 10
4 C 2 16
5 D 2 21
6 E 2 3
7 P 1 17
8 F 2 2
Столбец J указывает тип переменной, которая определена в K. Я хочу иметь возможность взять среднее значение K, которому присваивается 1. В этом примере это будет 10 и 17
T = c(10,17)
mean(T)
13.5
Далее я хочу иметь возможность назначить рейтинг прохождения / неудачи, где pass = 1, fail = 0, чтобы определить, больше ли число в столбце K, чем среднее значение.
Окончательный набор данных должен выглядеть следующим образом:
cdfrm <- list(L = c("A","B","P","C","D","E","P","F"), J=c(2,2,1,2,2,2,1,2), K=c(4,3,10,16,21,3,17,2),C = c(0,0,0,1,1,0,1,0))
cdfrm <-as.data.frame(cdfrm)
cdfrm
L J K C
1 A 2 4 0
2 B 2 3 0
3 P 1 10 0
4 C 2 16 1
5 D 2 21 1
6 E 2 3 0
7 P 1 17 1
8 F 2 2 0
это кажется таким простым, извините, ребята, я просто не знаю, о чем я думаю.