Суммируйте категориальные переменные по цифрам c: gtsummary package - PullRequest
0 голосов
/ 20 апреля 2020

Мне нужна помощь о том, как написать R-код с использованием пакета gtsummary для создания сводной таблицы с несколькими категориальными переменными в виде строк, а сторона столбца (переменная "by") - это переменная цифра c в моем случае, age in года. В сущности, я хотел бы суммировать некоторые категориальные характеристики пациентов по их среднему / среднему возрасту.

В качестве примера, в этом пакете с данными «испытание» я хотел бы, например, иметь в строке На оси таблицы указаны категориальные переменные (маркер, этап, оценка), а переменной by - «возраст», поэтому средний возраст для каждой категории этих переменных.

Спасибо за помощь. Nelly

1 Ответ

1 голос
/ 20 апреля 2020

Я не на 100% понимаю, о чем вы спрашиваете. Я предполагаю, что вы хотите суммировать данные по возрасту и возрасту (разделить на медиану в приведенном ниже примере)?

Сначала вы захотите создать категориальную переменную возраста.

library(gtsummary)
library(tidyverse)

df_age_example <-
  trial %>%
  mutate(
    # create a categorical age variable split at the median
    age2 = ifelse(
      age >= median(.$age, na.rm = TRUE),
      "Age Above or at Median",
      "Age Below Median"
    )
  ) %>%
  # keep variables to be summarized 
  select(age2, marker, grade)

Затем вы захотите передать этот фрейм данных в tbl_summary() для суммирования данных.

tbl_summary(data= df_age_example, by = age2)

Это приведет к приведенной ниже таблице.

enter image description here

Надеюсь, это поможет. Удачного кодирования!

...