Модель отношения продолжения для набора данных с категориальными и числовыми характеристиками - PullRequest
0 голосов
/ 09 июля 2019

Я пытаюсь подобрать модель коэффициента продолжения для моего набора данных, которая имеет как числовые, так и категориальные характеристики. Моя зависимая переменная является числовой и представляет продолжительность пребывания в больнице. Кроме того, я преобразовал целевую переменную в упорядоченную, как это предлагается в RDocumentation.

Я использовал следующие функции: glmnetcr(), glmpathcr(), vglm() (я установил аргумент "family" на "cratio"), train() (я установил аргумент "method" = "vglmContRatio") .

Ни одна из них не работает с типом переменных, которые есть в моем наборе данных. Метод работает только в том случае, если я преобразую все переменные в числовую форму, но в документации не указано, что матрица ковариат должна иметь только числовые характеристики.

Многие из категориальных переменных имеют больше уровней, и я ничего не пойму из моей модели. Есть ли какая-нибудь функция, которую я мог бы использовать, а также сохранить категориальные переменные?

Вот тип моих переменных:

$ Admission Type                     : Factor w/ 3 levels "Elective - Booked",..: 3 3 3 3 3 3 1 3 3 3 ...
 $ Treatment Function                 : Factor w/ 7 levels "BREAST SURGERY",..: 3 3 1 3 1 2 2 1 3 3 ...
 $ Main Health Care Provider Job Title: Factor w/ 25 levels "Colorectal Consultant",..: 4 4 6 4 7 8 4 7 4 4 ...
 $ Dominant Procedure OPCS Code       : Factor w/ 373 levels "A732","A752",..: 219 55 24 342 344 132 122 21 219 55 ...
 $ Procedure Code Desc                : Factor w/ 373 levels "Abdominolipectomy",..: 325 11 261 224 20 60 319 368 325 11 ...
 $ Primary Diagnosis ICD10 Code       : Factor w/ 330 levels "A099","A419",..: 220 169 32 162 30 183 16 32 220 139 ...
 $ Primary Diagnosis Desc             : Factor w/ 323 levels "Abdominal aortic aneurysm, without mention of rupture",..: 67 89 197 311 196 98 191 197 67 129 ...
 $ Secondary Diagnosis ICD10 Code     : Factor w/ 568 levels "A047","A099",..: 175 182 107 389 558 363 442 41 332 257 ...
 $ Secondary Diagnosis Desc           : Factor w/ 550 levels "Abdominal aortic aneurysm, without mention of rupture",..: 177 110 521 141 415 469 220 474 367 529 ...
 $ Theatre Description                : Factor w/ 30 levels "FGH Theatre 1",..: 12 12 16 12 16 21 21 16 12 12 ...
 $ ASA Code                           : Factor w/ 5 levels "1","2","3","4",..: 3 3 3 2 2 2 1 3 2 2 ...
 $ Anaesthetic Type                   : Factor w/ 11 levels "Block","Epidural Anaesthetic",..: 4 4 4 4 4 11 4 4 4 4 ...
 $ Was Operation Delayed?             : Factor w/ 2 levels "No","Yes": 2 2 2 2 2 2 2 2 2 2 ...
 $ Reason For Operation Delay         : Factor w/ 56 levels "Additions / Changes to List",..: 30 30 31 55 13 35 5 6 30 17 ...
 $ Is Readmission?                    : Factor w/ 2 levels "No","Yes": 1 1 1 1 1 1 1 1 1 1 ...
 $ Did Patient Die?                   : Factor w/ 2 levels "No","Yes": 1 1 1 1 1 1 1 1 1 1 ...
 $ Patient Age On Admit               : num  58 77 82 56 49 49 79 55 69 47 ...
 $ Patient Sex                        : Factor w/ 2 levels "Female","Male": 1 1 1 2 1 1 2 1 2 2 ...
 $ Patient Ethnicity                  : Factor w/ 15 levels "Any Other Ethnic Group",..: 14 14 14 11 14 11 14 14 14 14 ...
 $ Patient Deprivation Index Decile   : num  8 1 4 4 7 7 7 5 6 2 ...
 $ BMI                                : num  32.4 25.4 29.1 39.5 26.6 ...
 $ BMI Category                       : Factor w/ 4 levels "Healthy","Obese",..: 2 3 3 2 3 1 2 2 3 3 ...
 $ Smoking Status                     : Factor w/ 3 levels "Current Smoker",..: 2 2 2 1 3 2 2 1 2 3 ...
 $ Drinking Status                    : Factor w/ 2 levels "No","Yes": 2 1 2 2 2 1 2 2 2 2 ...
 $ OperationDuration                  : num  111 337 84 161 111 166 173 176 194 418 ...
 $ LOS                                : num  1 3 1 1 1 3 22 3 1 1 ...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...