Создание таблицы Сводка с использованием R - PullRequest
0 голосов
/ 30 сентября 2018

У меня есть набор данных с 2 столбцами, как показано.То, что я хочу сделать, это построить сводку таблицы со строками в виде групп (1-5, 6-10, 11-15, 16-20) и столбцами в виде% от да и нет.У меня нет кода, потому что я не знаю с чего начать.Но у меня есть набор данных.

Col 1   Col 2
 1       Yes
 2       No
 3       Yes
 4       No
 5       No
 6       No
 7       Yes
 8       Yes
 9       Yes
10       No
12       Yes
14       No
16       No
18       No
20       Yes

Ответы [ 2 ]

0 голосов
/ 30 сентября 2018

1) Использование только базы R и DF из примечания в конце:

nr <- nrow(DF)
group <- 5 * ceiling(DF$Col1 / 5)
100 * prop.table(xtabs(~ group + Col2, DF), 1)

, дающего:

     Col2
group       No      Yes
   5  60.00000 40.00000
   10 40.00000 60.00000
   15 50.00000 50.00000
   20 66.66667 33.33333

2) или с ярлыками группы любителей, попробуйте это, получая более приятные ярлыки, чем некоторые другие методы:

nr <- nrow(DF)

g <- 5 * ceiling(DF$Col1 / 5) # from above
labels <- unique(paste0(g-4, "-", g))
group <- factor(g, labels = labels)

tab <- 100 * prop.table(xtabs(~ group + Col2, DF), 1)

давая:

> tab
       Col2
group         No      Yes
  1-5   60.00000 40.00000
  6-10  40.00000 60.00000
  11-15 50.00000 50.00000
  16-20 66.66667 33.33333

> # another layout
> ftable(tab, row.vars = 1:2)

group Col2          
1-5   No    60.00000
      Yes   40.00000
6-10  No    40.00000
      Yes   60.00000
11-15 No    50.00000
      Yes   50.00000
16-20 No    66.66667
      Yes   33.33333

> plot(tab, col = c("pink", "lightgreen"))

screenshot

Примечание

Ввод DF в воспроизводимом виде:

Lines <- "Col1   Col2
 1       Yes
 2       No
 3       Yes
 4       No
 5       No
 6       No
 7       Yes
 8       Yes
 9       Yes
10       No
12       Yes
14       No
16       No
18       No
20       Yes"
DF <- read.table(text = Lines, header = TRUE)

Обновление

Исправлено несколько раз.

0 голосов
/ 30 сентября 2018

Решение Base R может включать cut и aggregate.

f <- cut(dat$Col.1, c(1, 6, 11, 16, 21, Inf),
         include.lowest = TRUE, right = FALSE)
agg <- aggregate(Col.2 ~ f, dat, table)
agg <- cbind(agg[1], agg[[2]])
agg[2:3] <- 100*agg[2:3]/rowSums(agg[2:3])

agg
#        f       No      Yes
#1   [1,6) 60.00000 40.00000
#2  [6,11) 40.00000 60.00000
#3 [11,16) 50.00000 50.00000
#4 [16,21) 66.66667 33.33333

Данные.

dat <-
structure(list(Col.1 = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 
10L, 12L, 14L, 16L, 18L, 20L), Col.2 = structure(c(2L, 1L, 2L, 
1L, 1L, 1L, 2L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L), .Label = c("No", 
"Yes"), class = "factor")), class = "data.frame", row.names = c(NA, 
-15L))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...