В соответствии с рекомендациями Bray, Lanzaa and Tanb (2015) Я хотел бы выполнить трехэтапный метод классификации людей по классам с использованием апостериорных вероятностей инклюзивного LCA (LCA, включая ковариаты). Тем не менее, инклюзивная модель сильно отличается от неинклюзивной модели, если я включу все представляющие интерес переменные.
Условные вероятности совершенно разные, равно как и число случаев на класс. Следовательно, интерпретация профилей или паттернов полностью меняется от неинклюзивной модели (шаг-1) при использовании апостериорных вероятностей инклюзивного ДМС (для назначения случаев).
У меня вопрос, я делаю что-то не так? Это нормально, чтобы получить эти изменения? Возможно процедура не правильная. Сама модель теряет смысл при рассмотрении условных вероятностей элементов каждого класса.
Вот шаги, которые я предпринял:
Провести ДМС для изучения профилей сексуального рискованного поведения (используя 6 переменных) и проанализировать связь с различными типами употребления наркотиков, полом и возрастом (модель 4 казалась лучшим выбором).
z <- cbind(sexrisk1, sexrisk2, sexrisk3, sexrisk4, sexrisk5, sexrisk6)
lc4 <- poLCA(z, MyData, nclass = 4,nrep=10)
Включите все переменные, представляющие интерес, в качестве ковариаты для «соответствующего» апостериорного анализа (в соответствии с рекомендациями Bray, Lanzaa and Tanb (2015))
f <- cbind(sexrisk1, sexrisk2, sexrisk3, sexrisk4, sexrisk5, sexrisk6)~ drug1+drug2+drug3+gender+age
lc4.cov <- poLCA(f, MyData, nclass = 4,nrep=10)
Как только инклюзивная модель выполнена, я использовал значения прогнозируемых классов и апостериорных вероятностей (которые, я думаю, poLCA делает это с помощью назначения с максимальной вероятностью. Не уверен в этом), чтобы назначать случаи классам членства.
table(lc4.cov$predclass)
write.csv(cbind(MyData$code, lc4.cov$posterior), 'new.data.csv')
(ПРИМЕЧАНИЕ: при увеличении количества nrep обеих моделей (включительно и не включительно) результаты апостериорных вероятностей показали меньшие различия).