Я использую процедуру SAS PSMATCH, чтобы сбалансировать когорты.Я рассчитываю оценку склонности отдельно, используя логистическую регрессию, а затем использую сгенерированный набор данных в PSMATCH с использованием PSDATA.Я делаю несколько итераций соответствия (чтобы получить наилучшие результаты) путем внесения изменений в области, метода (Оптимальный, Жадность и коэффициент переменной), переменной расстояния, значение штангенциркуля и отношение.Пожалуйста, найдите код ниже:
proc psmatch data=work.&data_set. region=®ion_var.;
class &cat_var.;
psdata treatvar = case_cntrl_fl(Treated='1') PS=prop_score;
match method=&mtch_method.(&k_method.=&k_val.) exact= &.exact_mtch_var.
stat=&stat_var. caliper(mult=stddev)=&caliper_var.;
assess lps ps var=(prop_score &covar_asses.) / plots = (boxplot cloudplot);
output out(obs=match)=WORK.psm ps=ps lps=lps matchid=_MatchID matchwgt = _MATCHWGT_;
run;
Меня беспокоит количество наблюдений, рассматриваемых на совпадение (т. Е. Все наблюдения).Полный набор данных логистической регрессии наблюдений представляет собой Лечебную ветвь 1: 531 и Лечебную ветвь 2: 3252 Тем не менее, в отчете PSMATCH Все наблюдения регистрируются как Лечебная ветвь 1: 446 и Лечебная ветвь 2: 2784 Результат согласуется независимо от изменений в методах PSMATCH.
Может ли кто-нибудь помочь мне понять возможную причину снижения количества?