Объединение двух перекрывающихся переменных в одном и том же фрейме данных в R - PullRequest
0 голосов
/ 26 ноября 2018

Я новичок здесь и не очень разбираюсь в статистике, определениях или терминах.Я постараюсь сделать все возможное, чтобы уточнить мой вопрос.

У меня есть фрейм данных под названием A, который содержит около 279 переменных и 3734 наблюдений.Каждое наблюдение представляет пациента, и существуют переменные, описывающие различные характеристики и атрибуты этих пациентов, такие как статус курения, артериальное давление, уровень глюкозы и их статус мертвого или живого в конце определенного периода.

У меня естьпеременная с именем A $ new_totmort выглядит следующим образом:

> A$test_totmort
> typeof(A$test_totmort)
> typeof(A$test_totmort)
[1] "double"
> class(A$test_totmort)
[1] "labelled" "numeric" 
> table(A$test_totmort)
   1    2 
3127  607

Переменная представляет группу, у которой была измерена определенная артериальная черта, и их статус «мертв / жив» к концу определенной даты.3127 вышли живыми, 607 - мертвыми.Причину смерти можно классифицировать по двум типам: сердечно-сосудистые события (инсульты и сердечные приступы) и не-сердечно-сосудистые события (все остальное, опухоли и т. Д.).

Теперь возьмем переменную A $ test_cvmort, котораяследующим образом:

> typeof(A$test_cvmort)
[1] "character"
> class(A$test_cvmort)
[1] "character"
> table(A$test_cvmort)
   0    1 
3529   50 

Как мы видим здесь, 50 человек погибли в CV событиях.Теперь мой вопрос заключается в следующем:

Как я могу объединить эти две переменные таким образом, чтобы все смерти были представлены в одной переменной следующим образом:

>table(A$my_desired_variable)
   0    1 
557    50

Где0 представляет смерти без CV, а 1 представляет смерти CV?

Я действительно надеюсь, что ясно дал понять, что я ищу.Я прошу прощения за неспособность указать то, что я хочу в краткости, которая является обычной.

Большое спасибо за помощь!

РЕДАКТИРОВАТЬ: Я решил это!

> A$test <- paste(A$test_cvmort, A$test_totmort)
> table(A$test)
0 0  0 1  1 1 NA 0 NA 1 
3050  479   50   77   78

, который в основном дал нужную мне переменную после некоторой корректировки:

0    1    2 
3050  557   50

, где 3050 живы, 557 мертвых в не-CV причины и 50 мертвых в CV причины.

...