Эффективный способ сделать это - использовать концепцию сопутствующих заболеваний. Мой пакет R icd делает это для стандартизированных наборов заболеваний, например «Диабет», «Рак», «Болезнь сердца». Существует выбор карт сопутствующих заболеваний, поэтому вы можете выбрать одну, которая соответствует вашим интересам, например, Карты PCCC в icd могут использоваться для педиатрии, остальные - для взрослых и охватывают различные болезненные состояния.
Например, как описано во введении виньетка . На самом деле это коды ICD-9, но вы можете использовать ICD-10.
patients <- data.frame(
visit_id = c(1000, 1000, 1000, 1000, 1001, 1001, 1002),
icd9 = c("40201", "2258", "7208", "25001", "34400", "4011", "4011"),
poa = c("Y", NA, "N", "Y", "X", "Y", "E"),
stringsAsFactors = FALSE
)
patients
visit_id icd9 poa
1 1000 40201 Y
2 1000 2258 <NA>
3 1000 7208 N
4 1000 25001 Y
5 1001 34400 X
6 1001 4011 Y
7 1002 4011 E
icd::comorbid_ahrq(patients)
CHF Valvular PHTN PVD HTN Paralysis NeuroOther Pulmonary DM DMcx Hypothyroid Renal Liver
1000 TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
1001 FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
1002 FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
PUD HIV Lymphoma Mets Tumor Rheumatic Coagulopathy Obesity WeightLoss FluidsLytes BloodLoss
1000 FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
1001 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
1002 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
Anemia Alcohol Drugs Psychoses Depression
1000 FALSE FALSE FALSE FALSE FALSE
1001 FALSE FALSE FALSE FALSE FALSE
1002 FALSE FALSE FALSE FALSE FALSE
С "DM" означает сахарный диабет, а "DMcx" означает диабет с осложнениями, например, ретинопатией или почечной недостаточностью. Это с американской модификацией AHRQ стандартных категорий Elixhauser.
Если у вас есть бинарные флаги для болезненных состояний, вы можете использовать их в любой статистической или машинной модели обучения.