создание таблицы 2x2 в R со значениями ячеек, являющимися третьей переменной, а не числом - PullRequest
0 голосов
/ 28 января 2020

Я хочу создать таблицу в R из большего набора данных. Таблица будет 2х2, однако значения в каждой ячейке будут значением третьей переменной, уже имеющейся в наборе данных. В частности, я смотрю на количество рецептов для класса лекарств по годам. Таким образом, одна сторона таблицы будет относиться к классу лекарств (либо А, либо В), а другая (2014-2018 годы), и каждая ячейка будет представлять количество рецептов.

В наборе данных каждая строка содержит статистику по данному лекарству за данный год. Каждый ряд не индивидуальный рецепт / пациент. Есть колонка для количества рецептов. Каждый. Все функции суммирования дают мне счет, который не то, что я ищу.

В конечном итоге я хотел бы сравнить долю пациентов в каждом классе лекарств по годам с помощью критерия хи-квадрат.

1 Ответ

1 голос
/ 29 января 2020

Составьте некоторые данные:

set.seed(42)
Diuretic <- sample(c("yes", "no"), 100, replace=TRUE)
Year <- sample(c(2014, 2015, 2016), 100, replace=TRUE)
Beneficiaries <- round(rnorm(100, 35, 5))
dta <- data.frame(Diuretic, Year, Beneficiaries)

Теперь используйте xtabs:

(dta.tbl <- xtabs(Beneficiaries~Diuretic+Year, dta)
#         Year
# Diuretic 2014 2015 2016
#      no   741  888  295
#      yes  448  649  429

Добавьте итоги:

addmargins(dta.tbl)
#         Year
# Diuretic 2014 2015 2016  Sum
#      no   741  888  295 1924
#      yes  448  649  429 1526
#      Sum 1189 1537  724 3450
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...