Есть ли способ стратификации таблицы R в непрерывной переменной - PullRequest
0 голосов
/ 10 января 2020

Я анализирую большой набор данных в R и при создании моего TableOne я хочу разделить общую выборку по наличию переменной. Я работаю с пациентами, которые получили измерение легочной гипертонии (непрерывная переменная), но в своей таблице я просто хочу сравнить пациентов, у которых было измерение, с теми, кто этого не сделал.

Любая помощь приветствуется. я знаю, что должен указать страты, но я не знаю, как это сделать для наличия непрерывной меры против тех, у кого нет меры (AKA. их ячейки были бы пустыми). Спасибо!

1 Ответ

0 голосов
/ 10 января 2020

Используйте group_by с is.na и summarise, чтобы найти сводную статистику.

library(dplyr)

# data creation
set.seed(1724)

df <- mtcars
df[runif(nrow(df)) > 0.6,]$disp <- NA

# analysis

df %>%
  group_by(is.na(disp)) %>%
  summarise(Count = n())

# A tibble: 2 x 2
  `is.na(disp)` Count
  <lgl>         <int>
1 FALSE            21
2 TRUE             11
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...